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引 
MATILAB 的 英文 全 称 是 Matrix Laboratory〈 和 矩阵 实验 室 )， 一 开始 它 是 一 种 专门 用 于 和 矩 

阵 数 值 计 算 的 软件 。 从 这 一 点 上 也 可 以 看 出 ， 它 在 矩阵 运算 方面 有 自己 的 特点 。 实 际 上 ， 
MATLAB 中 的 绝 大 多 数 运算 都 是 通过 矩阵 这 一 形式 完成 的 。 正 是 这 一 特点 决定 了 MATILAB 
在 处 理 数字 图 像 上 的 独特 优势 。 从 理论 上 讲 ， 图 像 是 一 种 二 维 的 连续 函数 ， 然 而 在 计算 机 上 
对 图 像 进 行 数字 处 理 时 ， 首 先 必须 对 其 在 空间 和 亮度 上 进行 数字 化 ， 即 图 像 的 采样 和 量化 过 
程 。 通 过 对 二 维 图 像 的 均匀 采样 ， 就 可 以 得 到 一 幅 离散 化 成 MxN 样本 的 数字 图 像 。 该 数字 
图 像 是 一 个 整数 阵列 ， 因 而 用 矩阵 来 描述 是 最 直观 和 最 简便 的 了 。 而 MATLAB 的 长 处 就 是 
处 理 矩 阵 运算 ， 因 此 用 MATLAB 处 理 数 字 图 像 非 常 方便 。 

MATLAB 支持 索引 色 图 像 、 灰 度 图 像 、 二 值 图 像 、RGB 图 像 和 多 帧 图 像 阵列 五 种 图 像 
类 型 ， 支 持 BMP、GIF、HDF、JPEG、PCX、PNG、TIFF、XWD、CUR、ICO 等 图 像 文件 
格式 的 读 、 写 和 显示 。MATLAB 对 图 像 的 处 理 功能 主要 集中 在 它 的 图 像 处 理工 具 箱 〈Image 
Processing Toolbox) 中 。 图 像 处 理工 具 箱 由 一 系列 支持 图 像 处 理 操作 的 函数 组 成 ， 可 以 进行 
诸如 几何 操作 、 线 性 滤波 和 滤波 器 设计 、 图 像 变 换 、 图 像 分 析 与 图 像 增 强 、 二 值 图 像 操 作 以 
及 形态 学 处 理 等 图 像 处 理 操作 。 

在 数字 图 像 处 理 领域 对 问题 的 求解 通常 需要 宽泛 的 实验 工作 ， 包 括 软件 模拟 和 大 量 样本 
图 像 的 测试 。 虽 然 典 型 算法 的 开发 是 基于 理论 支持 的 ， 但 这 些 算法 的 实现 几乎 总 是 要 求 参 数 
估计 ， 并 常常 进行 算法 修正 与 候选 求解 方案 的 比较 。 这 样 ， 灵 活 的 、 综 合 的 以 及 由 许多 资料 
证 明 的 软件 开发 环境 就 是 一 个 关键 因素 。 这 些 因素 在 开销 、 开 发 时 间 和 图 像 处 理 求解 方法 上 
都 具有 重要 意义 。 

尽管 它 很 重要 ， 但 却 很 少 有 以 教材 形式 编写 的 涉及 数字 图 像 处 理 原 理 和 软件 实现 方面 的 
文献 。 而 本 书 恰好 是 以 概要 形式 讲述 基本 理论 并 紧密 结合 实际 应 用 研究 为 目的 而 编写 的 。 

全 书 共 分 11 章 ， 第 1 章 介 绍 图 像 处 理 与 MATLAB 2007a 简介 ;第 2 章 介绍 图 像 的 编码 
和 解码 ;第 3 章 介绍 图 像 复 原 ， 第 4 章 介绍 图 像 处 理 的 相关 操作 ;第 5 章 介 绍 图 像 频 域 变 
换 ， 第 6 章 介 绍 图 像 处 理 中 的 代数 运算 及 几何 变换 ， 并 重点 介绍 图 像 几 何 的 变换 : 第 7 章 介 
绍 图 像 增强 ;第 8 章 介绍 图 像 分 割 与 边缘 检测 ;第 9 章 介 绍 小 波 分 析 及 其 在 MATLAB 中 的 
应 用 ， 主 要 讲述 小 波 技术 在 图 像 处 理 中 的 应 用 ， 并 详细 展开 小 波 分 析 在 图 像 增 强 中 的 应 用 ， 
如 基于 小 波 的 图 像 降 噪 和 压缩、 小 波 的 融合 技术 、 小 波 包 在 图 像 边 缘 检 测 中 的 应 用 ; 第 10 
章 介绍 图 像 特征 的 描述 ， 第 11 章 介 绍 MATLAB 图 像 处 理 的 应 用 ， 主 要 介绍 MATLAB 在 医 
学 和 遥感 图 像 处 理 方面 的 应 用 。 

本 书 结合 了 作者 多 年 来 的 教学 实践 和 研究 经 验 ， 并 力图 体现 以 下 三 个 特点 。 第 一， 将 图 
像 处 理 理论 和 应 用 举例 相 结合 ， 系 统 介绍 了 数字 图 像 处 理 技术 的 相关 知识 和 内 容 ， 每 介绍 一 
个 知识 点 的 理论 都 有 相应 的 应 用 举例 ， 使 读者 对 数字 图 像 处 理学 科 有 -个 全 面 的 了 解 ; 第 
二 ， 根 据 国内 有 关 专 业 本 科 生 和 研究 生 的 培养 规划 ， 介绍 了 图 像 处 理 技术 方面 的 新 理论 、 新 
技术 、 新 标准 和 新 应 用 ， 使 读者 充分 了 解 图 像 处 理 技术 的 新 发 展 和 新 应 用 ;第 三 ， 








MAILAB 图 像 处 理 功能 在 实际 生活 中 的 应 用 举例 ， 使 读者 学 以 致 用 。 

本 书 力求 内 容 丰 富 、 图 文 并 茂 、 文 字 流畅 ， 将 会 成 为 一 本 学 习 和 使 用 MATLAB 数字 图 
像 处 理 方面 有 价值 的 参考 书 。 

参加 本 书 编写 的 有 张 德 丰 、 许 华兴 、 王 旭 宝 、 王 重 群 、 邓 人 恒 奋 、 卢 国 伟 、 卢 焕 斌 、 伍 志 
聪 、 庄 文 华 、 庄 浩 杰 、 许 业 成 、 何 沛 桥 、 何 佩 贤 、 张 水 兰 、 张 坚 、 李 勇 杰 、 李 秋 兰 、 李 美 
妍 、 陈 运 英 、 陈 景 棠 、 梁 家 科 、 黄 达 中 、 陈 楚 明 、 林 健 锋 、 梁 劲 强 、 林 振 满 、 周 品 。 

由 于 时 间 仓促 ， 加 上 作者 水 平 所 限 ， 错 误 或 朴 漏 之 处 在 所 难免 ， 敬 请 读者 批评 指正 。 
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第 1 章 图 像 处 理 与 
MATLAB 2007a 简介 


1.1 概述 


MATLAB 是 一 种 面向 科学 与 工程 计算 的 高 级 语言 ， 允 许 用 数学 形式 的 语言 来 编写 程 
序 ， 比 BASIC、FORTRAN 和 C 语言 更 加 接近 书写 计算 公式 的 思维 方式 ， 用 MATLAB 编写 
程序 犹如 在 演算 纸 上 排列 出 公式 与 求解 问题 一 样 。 因 此 ，MATLAB 语言 也 可 以 通俗 地 称 为 

MATLAB 诞生 于 20 世纪 70 年 代 ， 它 的 编写 者 是 Cleve Moler 博士 和 他 的 同事 。 当 时 
Cleve Moler 博士 和 他 的 同事 开发 了 EISPACK 和 LINPACK 的 FORTRAN 子 程 请 
程序 主要 是 求解 线性 方程 的 程序 库 。 但 是 Cleve Moler 发 现 ， 学 生 使 用 这 两 个 程 片 
难 ， 主 要 原因 是 接口 程序 不 好 写 ， 很 费时 间 。 于 是 ，Cleve Moler 自己 动手 ， 在 业余 时 间 里 编 
写 了 EISPACK 和 LINPACEK 的 接口 程序 ，Cleve Moler 给 这 个 接口 程序 取 名 为 MATLAB， 意 
为 矩阵 〈Matrix) 和 实验 室 (Laboratory) 的 组 合 。 

1984 年 ，Cleve Moler 和 John Little 成 立 了 MathWorks 公司 ， 正 式 把 MATLAB 推 向 市 
场 ， 并 继续 进行 MATLAB 的 开发 。1993 年 MathWorks 公司 发 布 了 MATLAB 4.0，1995 年 发 
布 了 MATLAB 4.2C 版 (For Windows 3.x)，1997 年 发 布 了 MATLAB 5.0，2000 年 10 月 发 布 
了 MAILAB 6.0，2002 年 8 月 发 布 了 7 MATLAB 6.5，2004 年 9 月 发 布 了 MATLAB 7.0，2006 
年 3 月 发 布 了 7 MATLAB 2006a，2006 年 9 月 发 布 了 MATLAB 2006b，2007 年 3 月 发 布 了 最 
新 的 MATLAB 2007a。 每 一 新 版 本 的 推出 都 使 MATLAB 有 了 很 大 的 改进 一 一 界面 越 来 越 友 
好 ， 内 容 越 来 越 丰富 ， 功 能 越 来 越 强大 ， 帮 助 系统 越 来 越 完善 。MATILAB 2007a 增强 了 2 个 
新 产品 模块 ， 同 时 还 升级 和 修正 了 82 个 产品 模块 。 

MATLAB 擅长 数值 计算 ， 能 处 理 大 量 的 数据 ， 而 且 效率 比较 高 。MathWorks 公司 在 此 
基础 上 加 强 了 MATLAB 的 符号 计算 、 文 字 处 理 、 可 视 化 建 模 和 实时 控制 能 力 ， 增 强 了 
MATLAB 的 市 场 竞争 力 ， 使 MATLAB 成 为 市 场 上 主流 的 数值 计算 软件 。 

MAILAB 产品 族 支 持 从 概念 设计 、 算 法 开发 、 建 模仿 真 到 实时 实现 的 理想 的 集成 环 
境 。 无 论 是 进行 科学 研究 还 是 产品 开发 ，MATILAB 产品 族 都 是 必 不 可 少 的 工具 。MATLAB 
产品 族 具 有 如 下 主要 产品 。 

1) MATLAB: MathWorks 公司 所 有 产品 的 数值 分 析 和 图 形 基础 环境 。MATLAB 将 2D 











请 





和 3D 图 形 、MATLAB 语言 编程 集成 到 一 个 单一 的 、 易 学 易 用 的 环境 中 。 

2) MATLAB 工具 箱 : 一 系列 专用 的 MATLAB 函数 库 ， 用 于 解决 特定 领域 的 问题 。 工 
具 箱 是 开放 的 、 可 扩展 的 ， 可 以 查看 其 中 的 算法 或 开发 用 户 需 要 的 算法 。 

3) MATLAB 编译 器 : 将 MATLAB 语言 编写 的 M 文件 自动 转换 成 C 或 C++ 文件 ， 支 持 
用 户 进行 独立 的 应 用 开发 。 结 合 MathWorks 公司 提供 的 CC++ 数 学 库 和 图 形 库 ， 用 户 可 以 利 
用 MATLAB 快速 地 开发 出 功能 强大 的 独立 应 用 系统 。 

4) Simulink: 是 结合 了 框图 界面 和 交互 仿真 能 力 的 非 线性 动态 系统 仿真 工具 。 它 以 
MATLAB 的 数学 、 图 形 和 语言 为 基础 。 

5) Stateflow: 与 Simulink 框图 模型 相 结 合 ， 描 述 复杂 事件 驱动 系统 的 逻辑 行为 ， 驱 动 
系统 可 以 在 不 同 的 模式 之 间 进行 切换 。 

6) Real-Time Workshop: 直接 从 Simulink 框图 自动 生成 C 或 Ada 代码 ， 用 于 实现 快速 
原型 和 硬件 的 仿真 ， 整 个 代码 的 生成 可 以 根据 需要 完全 定制 。 

7) Simulink Blockset:， 专门 为 特定 领域 设计 的 Simulink 功能 模块 集合 ， 用 户 也 可 以 利用 
已 有 的 模块 或 自行 编写 的 C 和 MATLAB 程序 建立 自己 的 模块 。 


E5 数字 图 像 处 理 技术 的 内 容 与 发 展现 状 | 


数字 图 像 处 理 是 采用 一 定 的 算法 对 数字 图 像 进行 处 理 ， 以 获得 人 眼 视觉 或 者 某 种 接收 系统 
所 需要 的 图 像 过 程 。 数 字 图 像 处 理 的 基础 是 数学 ， 主 要 任务 是 进行 各 种 算法 设计 和 算法 实现 。 

目前 ， 数 字 图 像 处 理 技术 已 经 在 许多 不 同 的 应 用 领域 得 到 重视 ， 并 取得 了 巨大 成 就 。 根 
据 应 用 领域 要 求 的 不 同 ， 数 字 图 像 处 理 技术 可 以 分 为 许多 分 支 技术 ， 重 要 的 分 支 技术 有 

(1) 图 像 变换 

图 像 阵 列 很 大 时 ， 若 直接 在 空域 中 处 理 ， 计 算 量 将 很 大 。 为 此 ， 通 常 采 用 各 种 图 像 变换 
方法 ， 如 傅 里 叶 变换 、 沃 尔 什 变换 、 离 散 余弦 变换 、 小 波 变换 等 间接 处 理 技术 ， 将 空域 处 理 
转换 到 变换 域 处 理 ， 这 样 可 以 有 效 地 减少 计算 量 ， 提 高 处 理性 能 。 

(2) 图 像 增强 与 复原 

它 的 主要 目的 是 增强 图 像 中 的 有 用 信息 ， 削 弱 干扰 和 噪声 ， 使 图 像 更 加 清晰 ， 或 者 将 其 
转换 为 更 适合 人 或 机 器 分 析 的 形式 。 图 像 增强 并 不 要 求 真 实地 反映 原始 图 像 ， 而 图 像 复原 则 要 
求 尽量 消除 或 减少 获取 图 像 过 程 中 所 产生 的 某 些 退化 ， 使 图 像 能 够 反映 原始 图 像 的 真实 面貌 。 

(3) 图 像 压缩 编码 

在 满足 一 定 保 真 度 的 条 件 下 ， 对 图 像 信 息 进 行 编 码 ， 可 以 压缩 图 像 的 信息 量 ， 简 化 图 像 
的 表示 ， 从 而 大 大 压缩 图 像 描 述 的 数据 量 ， 以 便 存 储 和 传输 ， 图 像 压 缩 在 不 同 的 应 用 背景 下 
可 以 采取 不 失真 压缩 和 失真 压缩 。 

(4) 图 像 分 割 

图 像 分 割 是 数字 图 像 处 理 中 的 关键 技术 之 一 ， 是 为 了 将 图 像 中 有 意义 的 特征 提取 出 来 。 
它 是 进一步 进行 图 像 识别 、 分 析 和 理解 的 基础 。 图 像 中 有 意义 的 特征 包括 图 像 对 象 的 边缘 、 
区 域 等 。 

(5) 图 像 识 别 

图 像 识 别 属于 模式 识别 的 范畴 ， 其 主要 内 容 是 在 图 像 经 过 某 些 预 处 理 〈 增 强 、 复 原 、 压 
缩 )》 后 ， 进 行 图 像 分 割 和 特征 提取 ， 从 而 进行 判别 识别 。 图 像 识 别 常用 的 经 典 识别 方法 有 统 
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计 模 式 识别 和 句法 模式 识别 。 近 年 来 ， 新 发 展 起 来 的 模糊 模式 识别 和 人 工 神经 网 络 模式 识别 
在 图 像 识别 中 也 越 来 越 受到 重视 。 

以 上 数字 图 像 处 理 内 容 也 并 非 孤立 存在 的 ， 往 往 相 互联 系 ， 而 一 个 实用 的 图 像 处 理 系统 
也 通常 需要 将 几 种 图 像 处 理 技术 结合 起 来 ， 才 能 得 到 所 需要 的 结果 。 例 如 ， 图 像 变换 是 图 像 
编码 技术 的 基础 ， 而 图 像 增 强 与 复原 一 般 又 是 图 像 处 理 的 最 终 目 的 ， 也 可 作为 进一步 进行 图 
像 处 理工 作 的 准备 ， 通 过 图 像 分 割 得 到 的 图 像 特征 既 可 以 作为 最 后 结果 ， 也 可 以 作为 下 一 步 
图 像 分 析 的 基础 。 

不 同 的 图 像 处 理 技术 应 用 于 不 同 的 领域 ， 发 展 出 了 不 同 的 分 支 学 科 ， 如 时 感 图 像 处 理 、 

学 图 像 处 理 等 ， 其 他 如 计算 机 图 形 学、 模式 识别 、 人 工 智 能 和 机 器 人 视觉 等 学 科 领 域 也 与 
本 

图 像 处 理 技术 的 发 展 大致 经 历 了 初创 期 、 发 展期 、 普 及 期 和 实用 化 期 4 个 阶段 。 初 创 期 
开始 于 20 世纪 60 年 代 ， 当 时 的 图 像 采 用 像素 型 光栅 进行 扫描 显示 ， 大 多 采用 中 、 大 型 机 对 
其 处 理 。 在 这 一 时 期 ， 由 于 图 像 存储 成 本 高 、 处 理 设备 昂贵 ， 其 应 用 面 很 窄 。 进 入 20 世纪 
70 年 代 的 发 展期 ， 开 始 大 量 采用 中 、 小 型 机 进行 处 理 ， 图 像 处 理 也 和 逐渐 改 用 光栅 扫描 显示 方 
式 ， 特 别 是 CT 和 卫星 遥感 图 像 的 出 现 ， 对 图 像 处 理 技术 的 发 展 起 到 了 很 好 的 推动 作用 。 到 
了 20 世纪 80 年 代 ， 图 像 处 理 技术 进入 普及 期 ， 此 时 的 微机 已 经 能 够 担当 起 图 形 图 像 处 理 的 
任务 。 超 大 规模 集成 电路 〈Very Large Scale Integration，VLSI) 的 出 现 更 使 处 理 速 度 大 大 提 
高 ， 设 备 造价 也 进一步 降低 ， 极 大 地 促进 了 图 形 图 像 系统 的 普及 和 应 用 。20 世纪 90 年 代 是 
图 像 处 理 技术 的 实用 化 时 期 ， 图 像 处 理 的 信息 量 巨 大 ， 对 处 理 速度 的 要 求 极 高 。 

针对 现 有 的 实际 应 用 ， 数 字 图 像 处 理 具有 以 下 特 : 

1) 信息 量 大 ， 要 求 处 理 速度 比较 快 。 目 前 ， 数 字 图 像 处 理 的 信息 大 多 是 二 ， 
理 信 息 量 很 大 。 例 如 ， 一 幅 256 像素 x256 像素 低 分 辩 率 的 黑白 图 像 ， 要 求 约 64kbit 的 数据 
量 ; 对 512 像素 X512 像素 高 分 辩 率 的 彩色 图 像 ， 则 要 求 256kbit 的 数据 量 ， 如 果 要 处 理 
30f's 的 视频 图 像 ， 则 每 秒 要 求 处 理 500kbit 一 22.53Mbit 的 数据 量 。 因 此 ， 对 计算 机 的 计算 速 
度 、 存 储 容量 等 要 求 较 高 。 

2) 占用 频带 较 宽 。 与 语音 信息 相 比 ， 数 字 图 像 占 用 的 频带 要 大 几 个 数量 级 。 如 电视 图 
像 的 带宽 约 56MHz， 而 语音 带宽 仅 为 4kHz 左右 。 所 以 ， 数 字 图 像 在 成 像 、 传 输 、 存 储 、 
处 理 和 显示 等 各 个 环节 的 实现 上 ， 技 术 难 度 较 大 ， 成 本 高 ， 且 对 频带 压缩 技术 提出 了 更 高 
的 要 求 。 

3) 数字 图 像 中 各 个 像素 间 的 相关 性 强 ， 压 缩 潜力 大 。 在 图 像 画面 上 ， 经 常 有 很 多 像素 
有 相同 或 接近 的 灰 度 。 就 电视 画面 而 言 ， 同 一 行 中 相 邻 两 个 像素 或 相 邻 两 行 间 的 像素 ， 其 相 
关系 数 可 达 0.9 以 上 。 一 般 而 言 ， 相 邻 两 帧 之 间 的 相关 性 比 帧 内 相关 性 还 要 大 。 因 此 ， 图 像 
处 理 中 的 信息 压缩 潜力 巨大 。 

4) 图 像 质量 评价 受 主观 因素 影响 。 数 字 处 理 后 的 图 像 一 般 需 要 给 人 观察 和 评价 ， 而 人 
的 视觉 系统 很 复杂 ， 受 环境 条 件 、 视 觉 性 能 、 人 的 情绪 、 爱 好 以 及 知识 状况 影响 很 大 ， 因 此 
评价 结果 受 人 的 主观 因素 影响 较 大 。 为 此 ， 如 何 客 观 评价 图 像 质量 还 有 待 进一步 深入 研究 。 
另外 ， 计 算 机 视觉 是 模仿 人 的 视觉 ， 人 类 的 感知 原理 必然 严重 影响 计算 机 视觉 的 研究 。 

5) 图 像 处 理 技术 综合 性 强 。 数 字 图 像 处 理 技术 中 涉及 的 基础 知识 和 专业 技术 相当 广 
泛 ， 通 常 涉 及 通信 技术 、 计 算 机 技术 、 电 子 技术 、 电 视 技 术 以 及 更 多 的 数学 、 物 理 等 方面 的 
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基础 知识 。 例 如 ， 图 像 编码 的 理论 基础 是 信息 论 和 抽象 数学 的 结合 ， 而 图 像 识 别 则 需要 掌握 





随机 过 程 和 信号 处 理 方面 的 知识 。 此 外 ， 不 少 课题 还 需要 更 加 专业 的 知识 ， 如 小 波 变换 、 神 
经 网 络 、 分 形 理论 等 。 

另外 ， 数 字 图 像 处 理 是 一 门 应 用 性 很 强 的 学 问 ， 必 须 与 计算 机 技术 的 发 展 相 适应 。 随 着 
电子 技术 和 计算 机 技术 的 不 断 提 高 和 普及 ， 数 字 图 像 处 理 进入 高 速 发 展 时 期 ， 目 前 2GHz 以 
上 的 CPU 已 经 开始 推广 应 用 ， 这 将 大 大 促进 数字 图 像 处 理 技术 的 发 展 。 


1.2 ”相关 学 科 和 和 领域 


数字 信号 处 理学 

数字 信号 处 理学 (Digital Signal Processing) 是 指 用 数字 电路 和 数字 计算 机 对 信号 进行 数 
字 化 、 滤 波 等 处 理 ， 最 典型 的 信号 如 电压 、 电 流 等 随 着 时 间 变 化 的 一 维 物理 量 。 数 号 处 
理学 的 研究 内 容 包括 数字 化 原理 和 采样 定理 、 数 字 滤 波 器 、 数 字 正 交 变 换 、 数 字 信号 编码 压 
缩 与 传输 等 内 容 ， 其 中 最 重要 的 概念 包括 傅 里 叶 变 换 、 频 率 、 频 谱 、 滤 波 器 等 。 

数字 图 像 是 二 维 的 数字 信号 ， 是 随 空 间 坐标 变化 的 灰 度 值 或 颜色 值 ， 图 像 处 理 是 指 用 数 
字 电 路 和 数字 计算 机 对 图 像 进行 处 理 。 因 此 ， 数 字 图 像 处 理学 也 包括 数字 化 原理 和 采样 定 
理 、 图 像 滤 波 器 、 图 像 正 交 变换 、 图 像 编 码 和 压缩 与 传输 等 内 容 。 

由 此 可 见 ， 数 字 信号 处 理 与 数字 图 像 处 理 是 紧密 相关 的 学 科 ， 数 字 图 像 处 理 是 数字 信号 
处 理 理论 的 二 维 扩展 ， 数 字 信号 处 理 理论 中 的 进展 会 导致 数字 图 像 处 理 的 新 理论 和 方法 ， 而 
数字 图 像 处 理 的 进展 和 应 用 又 反 过 来 对 数字 信号 处 理 提 出 了 更 高 的 理论 研究 要 求 。 


计算 机 图 形 学 


计算 机 图 形 学 〈Computer Graphics) 是 指 用 计算 机 来 实现 图 形 的 生成 、 表 示 、 处 理 和 显 
示 。 计 算 机 图 形 学 的 研究 内 容 包括 物体 或 模型 的 数学 模型 、 图 形 生 成 、 几 何 透视 变换 、 消 隐 
(消去 隐藏 面 )、 覆 盖 表 面 纹理 、 光 照 模型 和 光线 跟踪 等 。 

计算 机 图 形 学 通常 是 由 数学 公式 经 过 计算 ， 最 终生 成 物体 或 模型 的 二 维 或 三 维 仿真 图 形 
〈 通 真 的 图 形 可 与 实际 图 像 媲 美 ); 而 数字 图 像 处 理 则 通常 是 由 数字 图 像 数据 进行 处 理 ， 最 
终 识别 出 图 像 中 的 景物 ， 甚 至 得 到 景物 的 统计 参数 和 数学 模型 。 因 此 ， 图 形 学 和 图 像 学 是 互 
逆 的 处 理 过 程 ， 二 者 是 有 本 质 区 别 的 。 

早期 的 图 形 通常 是 指 由 点 、 线 、 面 等 元 素来 表达 的 三 维 物体 ， 现 代 计 算 机 图 形 学 则 可 以 
生成 完全 台 真 的 图 像 ， 再 加 上 计算 机 图 形 学 的 设备 也 采用 几乎 相同 的 图 像 输 入 、 输 出 和 显示 
设备 ， 导 致 人 们 把 图 形 和 图 像 的 称谓 混淆 。 也 就 是 说 ， 图 的 共性 和 图 形 的 共性 ， 容 易 引起 图 
形 和 图 像 这 两 个 概念 的 混淆 ， 这 是 需要 注意 的 ， 也 是 可 以 理解 的 。 


计算 机 视觉 

计算 机 视觉 (Computer Vision) 是 研究 计算 机 感受 和 理解 自然 景物 的 理论 和 技术 ， 也 可 
以 是 研究 机 器 人 感受 和 理解 自然 景物 的 理论 和 技术 ， 所 以 也 称 为 机 器 视觉 Machine 
Vision)。 计 算 机 视觉 的 研究 和 设计 目的 是 依照 人 类 或 动物 的 视觉 系统 ， 开 发 出 能 够 感觉 和 理 
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解 自然 景物 的 计算 机 和 机 器 人 视觉 系统 

视觉 是 人 类 观察 世界 、 认 知 世 界 的 重要 功能 和 手段 。 人 类 从 外 界 获得 的 信息 约 有 
75% 来 自视 觉 系 统 ， 这 既 说 明 视 觉 + 巨 大 ， 也 表明 人 类 对 视觉 信息 有 较 高 的 利用 
率 。 人 类 视觉 过 程 是 一 个 从 感觉 【感受 图 像 : 三 维 世界 的 二 维 平面 投影 ) 到 认 知 〈 分 析 
图 像 : 由 二 维 图 像 推 断 和 理解 三 维 世界 的 内 容 及 相互 关系 ) 的 复杂 过 程 。 视 觉 的 目的 是 
要 对 场景 做 出 对 观察 者 有 意义 的 理解 和 描述 ， 并 可 以 根据 周围 环境 的 不 同和 观察 者 的 意 
愿 进行 相应 的 反应 和 动作 。 

计算 机 视觉 是 指 用 计算 机 实现 人 的 视觉 功能 ， 对 客观 世界 的 三 维 场景 进行 
别 和 理解 因此， 计算 机 视觉 也 研究 数字 图 像 和 数字 图 像 处 理 ， 但 其 研 :于 视觉 
的 立体 成 像 的 原理 、 图 像 处 理 方 法 及 实现 ， 或 视觉 动 图 像 的 成 像 原 理 、 处 理 方法 及 实 
现 。 因 此 ， 计 算 机 视觉 与 数字 图 像 处 理 是 紧密 相关 的 学 科 领 域 ， 二 者 相互 促进 、 相 互 依 
和 赖 和 相互 补充 。 


1.3 MATLAB 2007a 的 新 功能 
9 wvArs oo7a pojH| 


MATLAB 是 一 种 高 级 科学 计算 语言 ， 是 进行 数据 分 析 与 算法 开发 的 集成 开发 环境 。 
MATLAB 2007a 针对 编程 环境 、 代 码 效率 、 数 据 可 视 化 、 数 学 计算 、 文 件 IO 操作 等 方面 
都 进行 了 升级 ， 增 加 了 新 功能 。 为 此 ， 相 对 于 以 前 的 版 本 ，MATLAB 2007a 具有 一 些 新 的 
特性 。 

1 开发 环境 方面 

1) 重新 设计 的 桌面 环境 ， 针 对 多 文档 界面 应 用 提供 了 简便 的 管理 和 访问 方法 ， 允 许 用 
户 自 定义 桌面 外 观 ， 创 建 常用 命令 的 快捷 方式 。 

2) 增强 数组 编辑 器 (Array Editor) 和 工作 空间 浏览 器 〈Workspace Browser) 功能 ， 用 
于 数据 的 显示 、 编 辑 和 处 理 。 

3) 在 当前 目录 浏览 器 〈Current Directory Browser) 工具 中 ， 增 加 了 代码 效率 分 析 、 覆 

度 分 析 等 功能 。 

4) 增加 了 M-Lint 编码 分 析 ， 能 辅助 用 户 完 成 程序 性 能 分 析 ， 提 高 程序 的 执行 效率 。 

5) 增强 了 M 文件 编辑 器 〈(M-Editor) 的 功能 ， 可 以 支持 多 种 格式 的 源 代码 文件 可 视 化 
编辑 ， 如 C/C+t+、HTML、Java 等 。 

2 编程 方面 

1) 新 增 支持 创建 嵌 套 函数 〈(Nested Function) 功能 ， 并 且 提 供 了 更 加 灵活 的 代码 模块 化 
方式 。 

2) 具有 匿名 函数 (Anonymous Function) 功能 ， 支 持 在 命令 行 或 脚本 文件 中 创建 单 命令 
行 函数 (Single Command Line Function )。 

3) 具有 模块 化 注释 功能 ， 可 为 整个 代码 段 进行 注释 。 

3 数学 运算 方面 

1) 支持 整数 算术 运算 和 单 精度 数据 类 型 运算 ， 包 括 基本 算术 运算 、 线 性 代数 、FFT 操 
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2) 使 用 了 更 强大 的 计算 算法 包 Qhull 2002. 1， 支 持 更 丰富 的 计算 算法 。 
3) 利用 专门 的 linsove0O) 函 数 处 理 线性 代数 方程 的 求解 问题 。 
4) 提供 了 ODE 求解 器 ， 用 于 处 理 隐 性 微分 方程 组 及 多 点 边界 问题 。 
4 图形 和 3D 可 视 化 方面 
1) 对 图 形 窗 体 界面 进行 了 更 新 ， 并 且 能 直接 从 图 形 窗 体 生成 M 代码 ， 并 完成 用 户 自 定 
义 绘 图 。 
2) 增强 了 图 形 窗 体 的 注释 功能 。 
3) 提供 了 数据 侦 测 工具 〈Data Detection Tools)， 更 加 方便 了 数据 观测 与 跟踪 。 
4) 支持 自 定 义 图 形 对 象 ， 并 提供 了 丰富 的 图 形 显示 能 力 。 
5) GUIDE 新 增 了 对 用 户 界面 面板 和 ActiveX 控件 的 支持 。 
6) 增强 了 句柄 图 形 对 象 ， 可 以 支持 完整 的 TeX 和 LaTeX 字符 集 。 
5. 文件 MO 和 外 部 接口 方面 
1) 新 增 文件 IO 函数 ， 支 持 读 取 任意 格式 文本 数据 文件 ， 并 且 支 持 写 入 Excel 和 HDF5 
格式 数据 文件 。 
2) MAT 文件 格式 具有 压缩 功能 ， 可 进行 快速 数据 文件 的 IO 操作 。 
3) 使 用 javaaddpath() 函 数 ， 无 须 重新 启动 MATLAB 就 可 以 实现 Java 类 的 加 载 、 删 除 等 
功能 。 
4) 支持 COM、 服 务 器 事件 以 及 VBS。 
5) 支持 SOAP， 使 用 网 络 服务 。 
6) 支持 FTP 对 象 ， 可 以 直接 访问 FTP 服务 器 。 
7) 支持 Unicode 编码 格式 ， 增 强 了 MAT 文件 字符 集 。 
6. 性 能 与 系统 平台 支持 
1) 使 用 了 JIT 加 速 器 ， 支 持 所 有 数值 数据 类 型 。 
2) 在 Windows XP 操作 系统 下 ， 可 以 支持 3GB 内 存 访问 。 


Simulink 6 的 新 特性 


Simulink 是 交互 式 动态 系统 建 模 、 仿 真 和 分 析 的 图 形 环境 ， 是 进行 基于 模型 的 嵌入 式 系 
统 开发 的 基础 开发 环境 ， 可 以 用 于 控制 系统 、 信 号 处 理 以 及 通信 系统 等 的 建 模 、 仿 真 和 分 析 
等 工作 。Simulink 6 相对 于 以 前 的 版 本 ， 改 善 了 性 能 ， 并 且 针 对 大 规模 的 系统 开发 进行 了 性 
能 优化 ， 主 要 体现 在 以 下 方面 。 

1 大 系统 建 模 

1) 支持 将 大 系统 模型 分 割 为 不 同 的 文件 ， 且 每 个 文件 为 独立 的 系统 模型 。 

2) 支持 对 系统 的 不 同 模型 文件 进行 独立 的 仿真 测试 。 

3) 增强 了 系统 的 集成 功能 ， 支 持 配置 管理 和 版 本 控制 。 

4) 新 增 了 递增 式 模型 加 载 与 代码 生成 功能 。 

5) 针对 大 系统 模型 ， 提 高 了 运行 速度 和 执行 效率 。 

6) 对 于 模型 工作 空间 (Model Workspace)， 每 个 模型 都 可 以 有 独立 的 工作 空间 ， 可 以 
实现 独立 的 参数 管理 和 数据 处 理 。 
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7) 增强 了 总 线 的 支持 能 力 。 

2. Simulink 与 Sateflow 

1) 统一 的 模型 浏览 器 (Model Browser)， 用 于 浏览 、 维 护 、 配 置 、 搜 索 、 定 义 所 有 模 
型 中 相关 的 参数 、 数 据 对 象 和 属性 。 

2) 统一 的 仿真 和 代码 生成 选项 。 

3) 支持 创建 并 保存 多 种 仿真 和 代码 生成 选项 。 

4) 数据 管理 和 可 视 化 。 

5) 新 增 数据 对 象 属性 。 

6) 可 选 数据 记录 增加 涡 

7) IO 管理 ， 可 以 将 必要 的 





无 需 在 模型 中 增加 额外 的 模块 。 
源 和 信 宿 连接 到 模型 而 不 需要 增加 模块 。 


1.4 MATLAB 2007a 图 像 处 理 


由 于 图 像 操 作 很 多 ， 这 里 仅仅 以 MATLAB 窗口 的 操作 、 图 像 的 噪声 消除 和 边缘 检测 为 
例 ， 来 说 明 该 工具 的 基本 使 用 方法 。 


Ea MATLAB 图 像 处 理应 用 举例 | 


1. MATLAB 的 打开 
运行 安装 完成 的 MATLAB 程序 ， 若 在 桌面 上 建立 了 MATLAB 的 快捷 方式 ， 单 击 桌 面 
的 MATLAB 图 标 即 可 启动 MATLAB， 其 Command Window 窗口 如 图 1-1 所 示 。 








ATLAB 
Fil。 Bait Debug lnsktep Windoy lalz 
口 咏 | 关 下 本 局 忆 | 新台 目 | oaw 届 [] 


Shorteats 因 Mow te had 因 What s Rev 


To get started，select 莱 ILbB Help or Denos from the Help nen 





图 1-1 MATLAB 的 Command Window 窗口 


2. 图 像 输 入 到 计算 机 

将 所 需要 处 理 的 图 像 通 过 数码 相机 、U 盘 等 输入 设备 输入 到 计算 机 中 ， 并 确定 图 像 在 计 
算 机 中 存放 的 位 置 。 例 如 ， 图 像 存放 在 D:\MATLABYwork 中 。 

3. 打开 编辑 窗口 编写 程序 

启动 MATLAB 的 M 文件 编辑 器 ， 可 以 在 Command Window 窗口 中 选择 File 一 New 
一 M 一 File 命令 ， 即 可 建立 . M 文件 。 在 编辑 窗口 中 输入 要 处 理 图 像 的 源 程序 ， 如 图 1-2 
所 示 。 
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IT=iaread( trees.tif ) ; 
inhist (T) 
title( 直方 图 ") 
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图 1-2 ”编辑 程序 
4 保存 并 运行 
选择 Debug 一 Save and Run 命令 ， 即 可 运行 程序 并 保存 该 程序 。 程序 运行 结果 如 
图 1-3 所 示 。 
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图 1-3 ”程序 运行 结果 


5， 保存 运行 结 

若 想 将 运行 结果 保存 成 图 片 的 格式 ， 须 在 程序 中 加 入 图 像 IO 文件 中 的 图 像 写 入 图 形 文 
件 函 数 ， 即 imwrite (A，flename，fmnt)。 若 想 让 图 像 工 保存 在 D 盘 TAB 文件 夹 中 ， 文 件 名 
为 123， 文 件 格式 为 BMP， 可 用 语句 “imwrite (，'D:VTAB\123. BMP)”。 


E 图 像 处 理 基本 操作 | 


. 读 取 图 像 并 显示 
读 取 图 像 之 前 ， 应 该 首先 清除 MATLAB 所 有 的 工作 平台 变量 ， 并 关闭 打开 的 图 形 窗 
口 。 为 此 ， 可 使 用 以 下 命令 行 ; 





clear;y close all 
然后 使 用 图 像 选取 imread() 函 数 就 可 以 读 取 一 幅 图 像 。 假 设 1.4.1 节 读 取 图 像 为 trees. tf 
〈 该 图 像 是 图 像 处 理工 具 箱 自 带 的 图 像 )， 并 将 它 存储 在 一 个 名 为 工 的 数组 中 ， 以 上 可 以 使 


用 命令 





imread(trees. tif); 








然后 可 以 调用 imshow 命令 来 显示 图 像 : 
imshow(D) 


得 到 的 显示 结果 如 图 1-4 所 示 。 
2. 检测 内 存 中 的 图 像 
使 用 如 下 命令 可 以 查看 图 像 工 的 存储 方式 : 





whos 

运行 后 输出 结果 如 下 ， 
Name Size Bytes ”Class 图 1-4 读 取 的 原始 图 像 
1 258X350 90300 uintg array 


Grand total is 90300 elements using 90300 bytes 
以 上 输出 结果 说 明 图 像 采用 8 位 存储 方式 ， 并 占用 了 90300 B 的 存储 空间 。 
3. 实现 直方 图 均衡 化 
由 图 1-4 可 知 ，trees.tif 对 比 度 比较 低 ， 为 了 更 好 地 观察 图 像 的 灰 度 分 布 信息 ， 可 以 用 
imhist() 函 数 创建 描述 图 像 灰 度 分 布 的 直方 图 ， 并 使 用 figure 命令 将 直方 图 显示 在 一 个 新 的 图 
像 窗口 ， 如 图 1-3 所 示 。 
figure, imhist (0 % 在 新 图 中 显示 图 像 工 的 直方 图 
从 图 1-3 中 可 以 看 出 ， 由 于 图 像 的 灰 度 范围 比较 狭窄 ， 没有 覆盖 整个 灰 度 范围 [0， 
255] (图 像 的 默认 存储 类 型 为 unit8 )， 并 且 图 像 中 灰 度 值 的 高 低 区 分 不 明显 ， 因 而 不 能 产 
生 好 的 对 比 效 果 。 要 产生 较 好 的 对 比 效果 ， 可 以 调用 histep() 函 数 将 图 像 的 灰 度 值 扩展 到 
整个 灰 度 范围 中 ， 从 而 将 数组 I 的 对 比 度 提高 。 修 改过 的 图 像 数据 将 保存 在 变量 Z2 中 ， 
并 在 一 个 新 的 图 像 窗口 中 显示 均衡 处 理 的 图 像 2。 利 用 以 下 命令 行 ， 可 得 到 如 图 1-5 所 
示 的 处 理 结果 。 
Timread('trees tif) 
ID=histeq( 1 
figureiimshow(12 ) 
对 图 像 乙 ， 再 调用 imhist0 函 数 可 以 观察 均衡 后 图 像 的 灰 度 值 分 布 情况 ， 如 图 1-6 所 未。 
figureimhist(I2) 


通过 使 用 histeq() 函 数 来 调节 图 像 的 像素 分 布 ， 使 之 能 分 布 在 与 图 像 类 型 有 关 的 整 
个 取 值 范围 内 。 对 于 一 幅 图 像 ， 如 果 存 储 类 型 是 unit8， 那么 相应 的 取 值 范围 就 是 
fo, 256]， 如 果 存 储 类 型 是 unit16， 则 取 值 范围 是 [0, 655351]; 如 果 是 双 精度 类 型 ， 则 取 值 
范围 是 [0, 1] 。 

比较 图 1-3 和 图 1-6 可 知 ，L2 的 直方 图 比 工 的 直方 图 要 长 且 平坦 ， 这 种 铺展 直方 图 的 过 
程 就 叫 直 方 图 均衡 化 。 


FMATLAE 














图 1-5 均衡 后 图 像 图 1-6 均衡 后 图 像 的 灰 度 直方 多 
4 保存 图 像 
F 面 ， 将 把 均衡 化 后 的 图 像 !2 保存 到 磁盘 中 ， 如 果 希 望 将 该 图 像 保 存 为 PNG 图 像 文件 
格式 ， 则 可 以 使 用 imwrite0 函 数 ， 并 指定 该 保存 图 像 的 文件 名 和 文件 的 扩展 名 .png， 程 序 代 
码 如 下 : 








imwrite (I2,trees2. png); 


5 检查 新 生成 文件 的 内 容 

保存 图 像 后 ， 如 何 知道 磁盘 上 写 了 什么 内 容 呢 ? 可 以 使 用 imfinfo0) 函 数 来 观察 保存 的 图 
像 文件 信息 。 需 要 注意 的 是 ， 在 使 用 imfinfo0 函 数 时 ， 不 能 在 命令 行 示 尾 加 上 分 号 ， 这 样 才 
可 以 确保 MATLAB 能 够 显示 图 像 输出 结果 (只 有 imfinfo0 函 数 如 此 ， 其 他 显示 函数 加 不 加 
分 号 并 没有 影响 ， 以 下 不 再 说 明 )。 此 外 ， 还 须 保证 此 时 的 文件 路 径 与 调用 imwrite0) 函 数 时 
的 路 径 一 致 ， 如 以 下 命令 行 所 示 。 








imfinfo(trees2. png) 
系统 得 到 响应 ; 


ans = 
Filename: trees2. png' 
FileModDate:'10-Mar-2008 00:00:26' 
FileSize:55937 
Format:"pngy 
FormatVersion: [ 
Width: 350 
Height:258 
BitDepth: 8 
ColorType: 'grayscale' 
FormatSignature: [137 80 78 71 13 10 26 10] 


ES 图 像 处 理 的 高 级 应 用 ] 


在 上 面 的 操作 中 ， 读 者 对 MATLAB 中 的 一 些 基本 操作 已 有 了 一 定 的 了 解 ， 通 过 以 下 的 
练习 ， 将 掌握 MATLAB 的 一 些 较为 高 级 的 操作 。 的 主要 目的 是 消除 rice.tif 图 像 中 亮 











度 不 一 致 的 间 
象 的 个 数 以 及 统 
1. 读 取 和 显示 
清除 MATLAB 工作 平台 的 所 有 变量 ， 关 闭 已 经 打开 的 “国信 
图 形 窗口 ， 读 取 和 显示 灰 度 图 像 rice. png。 







clear'close al 
imread(rice. png?); 
imshow(D) 
2 估计 图 像 背景 
如 图 1-7 所 示 ， 图 像 中 心 位 置 的 背景 亮度 要 高 于 其 他 部 
分 的 亮度 。 在 MATLAB 7.0 中 ， 可 以 使 用 imopen0) 函 数 和 
个 半径 为 15 的 圆 盘 形 结构 元 素 对 输入 的 图 像 进行 形态 全 人 
学 开 操作 ， 去 掉 那 些 不 完全 包括 在 圆 盘 中 的 对 象 ， 从 而 实现 对 背景 亮度 的 估计 ， 其 程序 代 
码 如 下 : 








background=imopen(Lstrel(disk,15)); 

imshow(background) 
figure'surftdouble(background(1:8:end,1:8:end))),zlim([0 256]); 
Set(gcavYdirvreverse)); 


生成 的 背景 图 如 图 1-8a 所 示 。 图 1-8b 为 以 表面 图 形式 显示 的 背景 。 





3. 从 原始 图 像 中 减 去 背景 图 像 
现在 将 背景 图 像 background 从 原始 图 像 I 中 减 去 ， 从 而 创建 一 个 新 的 、 背 
图 像 ， 如 图 1-9 所 示 。 





致 的 


=imsubtract (Lbackground ); 
figure,imshow( 12 ) 
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图 1-9 除去 背景 后 的 图 像 





4. 调节 图 像 对 比 度 
从 图 1-9 可 以 看 出 ， 修 改 后 的 图 像 比 较 瞳 ， 可 以 使 用 MATLAB 提供 的 imadjust(O 函 数 来 
调节 图 像 的 对 比 度 ， 程 序 代码 如 下 : 











I3=imadjust(12,stretchlim(I2),[0 1]); 
figure,imshow(I3) 
调节 后 的 图 像 效 果 如 图 1-10 所 示 。 
5. 使 用 阅 值 操作 将 图 像 转换 为 二 进 制图 像 
使 用 graythresh0 和 lm2bw() 函 数 可 以 创建 一 个 新 的 二 值 图 像 BW， 如 图 1-11 所 示 。 














level=graythresh(I3); 
BW=im2bw(l3,leveD; 
figure,imshow(BW) 





图 1-10 调节 对 比 度 后 的 图 像 图 1-11 三 值 化 图 像 


调用 whos 命令 可 以 查看 图 像 的 存储 信息 : 


>> whos 
Name Size Bytes Class 
BW 256X256 65536 logical array 
TI 256X256 65536 uint8 array 
D 256X256 65536 uintg array 


13 256X256 65536 uintg array 
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background 。 256X256 65536 uint8 array 
level 1X1 8 double array 
Grand total is 327681 elements using 327688 bytes 


6. 检查 图 像 中 的 对 象 个 数 
为 了 确定 图 像 中 的 米粒 个 数 ， 可 以 使 用 bwlabel0) 函 数 。 该 函数 表示 了 二 值 图 像 BW 中 的 
所 有 相关 成 分 ， 并 且 返 回 在 图 像 中 找到 的 对 象 个 数 。 


[labeled,numObjects]=bwlabel(BW,4) 
numObjects = 
101 
对 于 图 1-11 中 有 些 相 互 连 接 的 米粒 ，bwlabel0 函 数 则 将 它们 视 为 同一 个 对 象 。 
7. 检查 标记 矩阵 
可 以 使 用 imcropO) 函 数 来 选择 并 显示 已 标记 的 对 象 和 部 分 背景 内 的 像素 。 选 择 一 个 较 小 
的 矩形 来 进行 这 操 项 作 ， 以 保证 显示 的 像素 值 不 会 引起 MATLAB 命令 窗口 的 滚动 。 以 下 语 
名 将 使 用 imcrop0 函 数 进行 交互 式 操作 ， 当 用 户 的 鼠标 位 于 图 像 范 围 内 ， 其 形状 会 变 成 十 字 
形 ， 通 过 单 击 鼠标 并 进行 拖 动 来 选择 一 个 标记 区 域 ， 选 择 完成 后 ，imcrop() 函 数 将 显示 用 户 
指定 的 标记 区 域 〈 根 据 选择 区 域 的 不 同 ，grain 显示 的 矩阵 是 不 同 的 )。 






grain = imerop(labeled) 


grain= 
多 
交 于 
人 
尖 避 5 不 让 罗 


观察 标记 矩阵 的 一 个 办 法 就 是 将 其 显示 为 一 幅 伪 彩色 的 索引 色 图 像 。 在 伪 彩 色 的 彩色 图 
像 中 ， 标 记 和 矩阵 中 的 每 一 个 对 象 都 将 被 映射 为 相关 调 色 板 中 的 不 同 颜色 ， 可 以 使 用 label2rgb 
色 板 中 的 对 应 颜色 ， 处 理 效果 如 图 1-12 所 示 。 


RGB_label=label2rgbllabelled,@spring,cvshufney; 
imshow(RGB_labeD) 





图 1-12 ” 伪 彩 色 索 引 色 图 像 
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第 2 章 图 像 的 编码 和 解码 


2.1 概述 






数字 图 像 已 经 在 人 们 的 生活 中 随处 可 见 ， 并 且 成 为 生活 中 不 可 缺少 的 一 部 但 是 图 像 
数字 化 之 后 ， 其 数据 量 是 非常 庞大 的 。 例 如 ， 一 幅 640 像素 x480 像素 分 辨 率 的 彩色 图 像 
(24biy 像素)， 其 数据 量 为 900KB 。 如 果 以 30fs 的 速度 播放 ， 则 每 秒 的 数据 量 为 
640x480x24x30bit =210.9Mbit-26.4MB， 需 要 210.9Mbit/s 的 通信 回路 ; 如 果 存 放 在 650MB 
的 光盘 中 ， 在 不 考虑 音频 信号 的 情况 下 ， 每 张 光盘 也 只 能 播放 24s。 毫 无 疑问 ， 如 果 不 进 行 
编码 压缩 处 理 ， 在 图 像 存 储 中 所 遇 到 的 困难 和 成 本 之 高 是 可 想 而 知 的 。 对 于 利用 电话 线 传送 
遇 白 二 值 图 像 的 传真 ， 如 果 以 200dpi (点 /英寸 ) 的 分 辨 率 传输 ， 一 张 A4 稿 纸 内 容 的 数据 量 
为 (200x210/25.4) x (200x297/25.4)bit=3866948bit， 按 目前 14.4kbivs 的 电话 线 传输 速率 ， 
需要 传送 的 时 间 是 263s (4.4min)。 图 2-1 为 压缩 后 的 图 像 。 















图 2-1 原 图 像 数 据 为 8.5SMB， 压 缩 后 (Buaajpg) 为 0.98MB 


总 之 ， 大 数据 量 的 图 像 信息 会 给 存储 器 的 存储 容量 、 通 信 王 线 信道 的 带宽 以 及 计算 的 处 
理 速度 增加 极 大 的 压力 。 单 纯 靠 增加 存储 容量 ， 提高 信道 带宽 以 及 计算 机 的 处 理 速度 等 方法 
来 解决 这 个 问题 是 不 现实 的 ， 这 时 就 要 考虑 压缩 。 因 此 ， 图 像 数据 在 传输 和 存储 中 ， 数 据 的 
压缩 都 是 必 不 可 少 的 。 


图 像 压 


图 像 压 缩 的 理论 基础 是 信息 论 。 从 信息 论 的 角度 来 看 ， 压 缩 就 是 去 信息 中 的 元 余 ， 即 
保留 不 确定 的 信息 ， 去 掉 确 定 的 信息 《可 推 知 的 )， 也 就 是 用 一 种 更 接近 ` 质 的 描述 来 
代 蔡 原 有 宛 余 的 描述 。 一 幅 图 像 存 在 着 大 量 的 数据 了 见 余 和 主观 视觉 元 余 ， 因 此 图 像 数据 压缩 















14> 








既是 必要 的 ， 也 是 可 能 的 。 
本 身 的 特征 带 来 数据 压缩 的 可 能 性 
全 









完 余 。 通 常 邻近 像素 灰 度 分 布 的 相关 性 很 强 。 例 如 ， 图 2-2a 所 示 的 条 状 物体 排列 比较 整 
齐 ， 如 果 用 水 平方 向 的 任何 一 行 像素 预测 垂直 方向 的 其 他 行 像素 ， 都 能 够 准确 预测 其 他 行 数 
据 ， 其 他 行 数据 完全 能 够 用 一 行 数 据 复 到 。 图 2-2b 中 也 有 4 个 相同 的 条 状 物体 ， 但 是 
随便 摆 放 ， 就 不 能 用 图 2-2b 中 某 一 行 预测 其 他 行 。 我 们 称 图 2-2a 中 数据 存在 较 大 元 余 ， 能 
够 给 图 像 压缩 提供 较 大 压缩 空间 。 

(2) 时 域 

时 域 元 余 又 称 时间 宛 余 ， 它 是 针对 视频 图 像 而 言 的。 视频 序 列 为 25 一 30fks 的 图 像 ， 连 续 
播放 ， 相 邻 由 之 间 的 时 间 间 隔 很 小 〈 例 如 ，25fxs 的 电视 信号 ， 其 帧 间 时 间 间 隔 只 有 0.04s); 
同时 ， 实 际 生活 中 的 运行 物体 具有 运行 一 致 性 ， 使 得 视频 序列 图 像 之 问 有 很 强 的 相关 性 。 
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图 2-2 图 像 
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间 宛 余 或 几何 元 余 ， 空 域 元 余 是 一 种 与 像素 间 相 关 性 直接 联系 的 数据 攻 














a 比较 整 





b) 随便 摆 放 条 形 物 


例如 ， 图 2-3a 是 一 组 视频 序列 的 第 1 帧 ， 图 2-3b 是 第 2 帧 。 人 眼 很 难 发 现 两 帧 图 像 的 
差别 ， 如 果 视 频 连续 播放 ， 人 眼 就 更 难看 出 两 帧 图 像 有 差别 了 。 两 帧 图 像 越 接近 ， 说 明 图 像 
扒 息 越 少 。 换 名 话说， 第 2 帧 相对 第 1 帧 而 言 ， 存 在 大 量 元 余 。 对 于 视频 压缩 而 言 ， 
时 域 元 余 是 视频 图 像 压 缩 中 可 利用 的 最 主要 的 元 














图 2-3 图 像 的 时 域 兄 余 


al) 第 1 帧 视频 图 b) 第 二 帧 视频 图 








(3) 频 域 兄 余 

频 域 元 余 是 针对 目前 普通 使 用 的 变换 编码 而 言 的 。 绝 大 部 分 变换 编码 将 空域 的 图 像 变换 
到 频 域 中 ， 使 得 大 量 的 信息 能 用 较 少 的 数据 来 表示 ， 从 而 达到 压缩 的 目的 。 从 空域 转化 到 频 
域 ， 去 除了 图 像 像素 在 空域 的 相关 性 ， 然 而 人 们 发 现 ， 图 像 在 频 域 的 表示 〈 频 谱系 数 )， 同 
样 存在 兄 余 。 大 多 数 图 像 的 频谱 具有 低 通 特性 ， 低 频 部 分 的 系数 能 够 提供 绝 大 部 分 的 图 像 信 
息 ， 保 留 低频 部 分 的 系数 ， 而 丢弃 高 频 部 分 的 系数 ， 因 此 保持 了 大 部 分 图 像 能 量 ， 在 恢复 图 
像 时 带 来 的 质量 劣化 并 不 明显 ， 去 除 频 域 的 元 余 ， 能 够 进一步 提升 压缩 的 空间 ， 可 提高 编码 
效率 。 

(4) 信息 灶 元 余 

图 像 中 像素 灰 度 出 现 的 不 均匀 性 ， 会 造成 图 像 信 息 箭 元 余 ， 即 用 同样 长 度 比 特 表 示 每 
个 灰 度 ， 则 必然 存在 元 余 。 若 将 出 现 概率 大 的 灰 度 级 用 长 度 较 短 的 码 表示 ， 将 出 现 概率 小 的 
灰 度 级 用 长 度 较 长 的 码 表 示 ， 有 可 能 使 编码 总 长 度 下 降 。 

2. 应 用 环境 允许 图 像 有 一 定 程度 的 失真 

1) 接收 端 图 像 设 备 分 辩 率 较 低 ， 则 可 降低 图 像 分 辩 率 。 

2) 用 户 所 关心 的 图 像 区 域 有 限 ， 可 对 其 余部 分 图 像 采 用 空间 和 灰 度 级 上 的 粗 化 。 

3) 根据 人 的 视觉 特性 对 不 敏感 区 域 进行 降 分 辩 率 编码 〈 视 觉 元 余 )。 

可 以 利用 视觉 的 这 一 特点 编码 去 除 人 眼 的 视觉 元 余 。 通 常 ， 人 眼 能 够 分 辨 的 灰 度 级 有 
限 ， 同 时 ， 它 所 感受 的 图 像 区 域 物体 的 亮度 不 仅仅 与 物体 的 反射 光 有 关 ， 还 具有 马赫 带 效 
应 、 同 时 对 比 度 、 视 觉 暂 留 及 视觉 非 线性 等 特点 ， 有 些 信息 在 通常 的 视觉 感知 过 程 中 并 不 那 
么 重要 ， 这 些 信息 可 被 认为 是 视觉 元 余 ， 去 除 这些 爷 余 ， 人 眼 不 会 明显 地 感受 到 图 像 质量 的 
降低 ， 视 觉 元 余 也 给 图 像 压 缩 提供 了 可 能 


2.1.3 

在 图 像 压 缩编 码 中 ， 解 码 图 像 与 原始 图 像 可 能 会 有 差异 ， 因 此 ， 需 要 评价 压缩 后 图 像 的 
质量 。 描 述 解码 图 像 相对 原始 图 像 偏 离 程度 的 测度 一 般 称 为 保 真 度 〈 逼 真 度 ) 准则 。 常 用 的 
准则 可 分 为 客观 保 真 度 准 则 和 主观 保 真 度 准则 两 大 类 。 

1. 客观 保 真 度 准则 

最 常用 的 客观 保 真 度 准则 是 原始 图 像 和 解码 图 像 之 间 的 方 均 根 误差 和 方 均 根 信 噪 比 两 
种 。 令 j(xy) 代表 原 图 像 ， /xy) 代表 对 (cy) 先 压缩 又 解压 缩 后 得 到 的 /xz, 芒 的 近似 
值 ， 对 任意 x 和 yoxsy) 和 广 zx, 妇 之 间 的 误差 定义 为 

eco= xD-7GcD) (C2-1) 


车 Je 人 和 刻 x 四 均 为 MxN ， 则 它们 之 间 的 方 均 根 误差 em 为 


























ems - 款 吕 pe 尹 -Go 站 《222) 


二 
如 果 将 六 xc,y) 看 做 原始 图 像 fc y) 和 噪声 信号 eCx,y) 的 和 ， 那 么 解压 图 像 的 方 均 信 噪 
比 SNR。。 为 





分 贝 (dB) 表示 ， 令 


则 有 


MA 、 Al 、 
SNR = 2 2 亡 C)/ 2 [oo)-Aocy (2-3) 


x=07=0 x=07y=0 


如 果 对 上 式 求 平 方 根 ， 就 得 到 方 均 根 信 噪 比 SVR。 。 实 际 


实际 使 用 中 常 将 SNR。。 归 一 化 并 用 包 


国 二 站 
邯 闻 大 包 名 1 〈2-4) 
MA 
之 怀 [Go)- 开 
SNVR=I0gsl (2-5) 
忆 乞 [cy)- 7 
邹 名 


如 果 令 太 。 = max jx,y),xz= 0.1…,M -1Ly= 0,1…,N -1， 则 可 得 到 峰值 信 噪 比 PSVR: 


2 
PsR-iele es (2-6) 
闷 >[LAeoc)- oo 
扎 乌 


2， 主观 保 真 度 准则 

尽管 客观 保 真 度 准 则 提供 了 一 种 简单 、 方 便 的 评估 信息 损失 的 方法 ， 但 很 多 解压 图 像 最 
终 是 供 人 观看 的 。 事 实 上 ， 具 有 相同 客观 保 真 度 的 不 同 图 像 ， 人 的 视觉 可 能 产生 不 同 的 视觉 
效果 。 这 是 因为 客观 保 真 度 准则 是 一 种 统计 平均 意义 下 的 度量 准则 ， 对 于 图 像 中 的 细节 无 法 
反映 出 来 。 而 人 的 视觉 系统 具有 独特 的 特性 ， 能 够 觉察 出 来 。 这 种 情况 下 ， 用 主观 的 方法 来 
测量 图 像 的 质量 更 为 合适 。 一 种 常用 的 方法 是 对 一 组 〈 不 少 于 20 人 ) 观察 者 显示 图 像 ， 并 
将 他 们 对 该 图 像 的 评分 取 平均 ， 用 来 评价 一 幅 图 像 的 主观 质量 。 

评价 也 可 以 对 照 某 种 绝对 尺度 进行 。 表 2-1 给 出 一 种 对 电视 图 像 质 量 进行 绝对 评价 的 尺 
度 ， 根 据 图 像 的 绝对 质量 进行 判断 打分 。 也 可 通过 将 /gx,) 和 六 zx, 比较 并 按照 某 种 相对 的 
尺度 进行 评价 。 如 果 观 察 者 将 /tx,?) 和 zx,7) 逐个 进行 对 照 ， 则 可 以 得 到 相对 的 质量 分 。 


























例如 ， 可 用 {-3，-2，-1，0，1，2，3} 来 代表 主观 评价 { 很 差 ， 较 差 ， 稍 差 ， 相 同 ， 稍 好 ， 
较 好 ， 很 好 } 。 
表 2-1 电视 图 像 质 量 评价 尺度 
评 分 评 ” 价 说 明 

1 优秀 图 像 质 量 非常 好 ， 如 同人 能 想像 出 的 最 好 质量 

芝 良好 图 像 质量 高 ， 观 看 舒服 ， 有 干扰 但 不 影响 观看 

3 可 用 图 像 质量 可 以 接受 ， 有 干扰 但 不 太 影响 观看 

人 刚 可 看 图 像 质 量 差 ， 干 扰 有 些 妨碍 观看 ， 观 察 者 希望 改进 

多 差 图 像 质量 很 差 ， 妨 碍 观看 的 干扰 始终 存在 ， 几 乎 无 法 观看 








避 


不 能 用 





图 像 质量 极 差 ， 不 能 使 用 












的 不 确定 性 度量 ， 消 息 的 可 能 性 愈 小 ， 其 殖 含 的 
愈 大 ， 反 之 ， 消 息 的 可 能 性 愈 大 ， 则 其 

假设 从 个 数 中 选中 某 个 数 x 的 概率 
息 为 


息 就 愈 多 ， 即 不 确定 程度 
愈 少 ， 即 不 确定 程度 愈 小 。 
Pro ， 则 根据 Shannon〈 香 农 ) 理论 ， 定 义 其 信 









10=-log, POCO) 妈 -7 
如 果 将 信 源 所 有 可 能 事件 的 信息 量 进 行 平均 ， 就 得 到 信息 和 〈entropy)， 所 谓 精 就 是 平 
均 信 





xx 的 符号 集 为 切 (=12, ， 设 立 出 现 的 概率 为 PCoxs) ， 则 信 源 x 的 焙 为 
万 CD = )X[PCo]= 这 re )log; Pr) (2-8) 


根据 Shannon 无 噪声 编码 定理 ， 对 于 精 为 万 的 信 源 ， 对 其 无 失真 编码 ， 所 能 达到 的 最 
大 值 为 ( 末 +e)bit/ 每 符号 ， 这 里 < 为 一 任意 小 的 正 数 ， 因 此 可 能 达到 的 最 大 压缩 比 为 
的 3 
CC (2-9) 
式 中 ，B 一 一 原始 图 像 的 平均 比特 率 ， 且 定 义 压缩 比 为 








0 (2-10) 
C -下 开拓 的 平 区 毕 素 (7 ) 
方 均 信 噪 比 为 
归 
SNR = (2-11) 
Ce 
方 淘 根 信 品 比 为 
SNR = JSNRR (2-12) 


E5 Shannon Fano 编码 ] 


种 常用 的 变 长 编码 是 Shannon Fano 编码 ， 这 种 编码 有 时 也 可 以 得 到 最 优 编码 性 能 。 
它 的 编码 准则 要 符合 非 等 长 条 件 ， 在 码 字 中 1 和 0 是 独立 的 ， 而 且 是 《或 差不多 是 ) 等 概率 
样 的 准则 一 方面 可 保证 无 需 用 间隔 来 区 分 码 字 ， 同 时 又 保证 每 传输 1 位 码 就 草 含 着 1 








为 定义 有 效 的 代码 表 ， 设 计 了 一 0 Fano。 编 码 就 是 根据 该 算法 建 
立 的 。 其 主要 准则 是 :在 码 字 中 ，1 与 0 是 独立 的 ， 而 且 几 乎 是 等 概率 。 实 际 算法 如 下 ; 

1) 对 于 一 个 给 定 的 符号 序列 ， 和 个 概率 或 频率 记 数 序列 ， 使 每 个 符号 的 相对 出 现 
频率 已 知 。 

2) 根据 频率 对 符号 进行 排序 ， 频 率 最 高 的 在 顶部， 频率 最 低 的 在 底 前 

3) 将 序列 分 成 两 部 分 ， 上 半 部 分 的 频率 之 和 尽 可 能 接近 下 半 部 分 的 频率 之 和 。 











4) 序列 的 上 半 部 分 赋 给 二 进 制 数字 0， 而 下 半 部 分 赋 给 二 进 制 数字 1 。 

5) 对 所 分 的 两 部 分 ， 分 别 重复 使 用 第 3) 步 和 第 4) 步 ， 直 到 不 能 再 分 为 止 。 具 体 实 现 
过 程 如 图 2-4 所 示 。 

由 图 2-4 可 知 ， 出 现 频率 高 的 字符 在 编码 中 只 占有 较 少 的 位 数 ， 这 显然 是 合理 的 ， 因 为 总 
一 个 给 定 字符 的 信息 容量 公式 是 字符 出 现 概率 以 2 为 底 的 对 数 的 负 值 。 


符号 出 现 次 数 编码 


”” 第 一 次 划分 


。。 第 二 次 划分 
“"" 第 一 次 划分 
"第 三 次 划分 


“第 二 次 划分 
”第 一 次 划分 
“”" 第 三 次 划分 
"" 第 四 次 划分 





图 2-4 Shannon Fano 编码 实现 





哈 夫 曼 〈Hufftman) 编码 是 哈 夫 曼 树 的 一 个 应 用 。 哈 夫 曼 编码 应 用 广泛 ， 如 JPEG 中 就 
应 用 了 哈 夫 曼 编码 。 

哈 夫 曼 树 又 称 为 最 优 二 又 树 ， 是 一 种 加 权 路 径 长 度 最 短 的 二 又 树 。 所 谓 树 的 加 权 路 径 长 
度 ， 就 是 树 中 所 有 叶 节点 的 权 值 乘 上 其 到 根 节点 的 路 径 长 度 ， 若 根 节点 为 0 层 ， 叶 节点 到 根 
节点 的 路 径 长 度 为 叶 节点 的 层 数 ， 记 为 PPL=( 所 x 石 + 豚 x 厂 + 两 x 厂 二 十 于 xx 五 ) 表 示 六 个 
权 值 玉 C=12…,m) 构成 一 棵 有 半 个 叶 节 点 的 二 叉 树 ， 相 应 的 叶 节 点 的 路 径 长 度 为 
厂 人 =12…,。 可 以 证 明 哈 夫 曼 树 的 及 PL 是 最 小 的 。 

哈 夫 曼 编 码 是 20 世纪 50 年 代 初 由 哈 夫 曼 提 出 的 ， 它 根据 字符 出 现 的 概率 来 构造 平 
均 长 度 最 短 的 编码 ， 是 一 种 变 长 编码 ， 如 果 各 码 字 长 度 严格 按照 码 字 所 对 应 的 符号 出 现 
概率 大 小 的 逆序 排列 ， 则 编码 的 平均 长 度 最 小 。 需 要 说 明 的 是 ， 码 字 即 为 符号 经 哈 夫 曼 
编码 后 得 到 的 编码 ， 其 长 度 因 符 号 出 现 的 概率 的 不 同 而 不 同 ， 因 此 是 变 长 度 的 。 图 2-5 
是 哈 夫 曼 编 码 实例 。 

哈 夫 曼 编码 的 编码 步骤 如 下 : 

1) 将 信 源 符号 出 现 的 概率 按 递 减 的 顺序 排列 。 

2) 将 两 个 最 小 的 概率 进行 组 合 相 加 ， 并 重复 该 步骤 ， 始 终 将 较 高 的 概率 分 支 放 在 上 


















部 ， 直 到 概率 等 于 1 为 止 。 


3) 对 每 一 个 组 合 中 的 元 素 进行 1 位 码 字 分 配 ， 如 概率 较 大 的 元 素 分 配 码 字 1， 概 率 较 
小 的 元 素 分 配 码 字 0， 反 向 分 配 也 可 以 。 
4) 对 每 个 信 源 符号 从 右 到 左 排列 ， 分 配 码 字 序列 ， 得 到 非 等 长 度 的 哈 夫 曼 编码 。 





















































户 痊 户 起 忆 此 
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图 2-5 ” 哈 夫 曼 编码 实例 


实际 应 用 中 ， 由 于 在 哈 夫 曼 编 码 之 前 需要 知道 信 源 数据 符号 〈 叶 节点 ) 的 概率 ， 则 为 要 
求 做 实时 编码 的 作业 带 来 了 麻烦 。 因 此 ， 目 前 在 实时 编码 作业 中 ， 大 多 采用 所 谓 准 可 变 字 长 
码 ， 例 如 ， 采 用 双 字 长 编码 ， 并 从 短 码 集合 中 留 出 一 个 码 子 ， 作 为 长 码 字 头 ， 以 保证 码 字 的 
非 续 长 特性 。 此 外 ， 在 数字 图 像 通信 所 用 的 三 类 传真 机 中 的 MH 码 ， 则 采用 了 多 字 长 VLC 
技术 ， 它 是 根据 一 系列 标准 图 像 的 统计 分 析 结果 ， 预 先 在 其 IC 芯片 中 做 好 码 表 ， 使 得 实际 
的 编码 解码 作业 简化 为 一 个 查 表 过 程 ， 从 而 满足 了 高 速 实时 处 理 的 需要 。 

下 面 给 出 哈 夫 曼 编 码 的 MATLAB 实现 。 

程序 将 输入 的 向 量 〈 和 矩阵 ) 进行 哈 夫 曼 编码 ， 然 后 反 编码 ， 判 断 是 否 是 无 失真 编码 ， 最 
后 给 出 压缩 前 后 的 存储 空间 的 比较 。 


clear all 

fprintfReading data..) 

data = imread(cameraman tif); 

data = uintg(data); % 读 入 数据 ,并 将 数据 限制 为 uint8 
fprintfrDoneln') 

% 编 码 压缩 

fprintftcompressing data …); 

[zipped,info] = norm2hufftdata); 

fprintfrDonetn) 

% 解 压缩 


fprintftcompresing data 








unzipped = huffPPnorm(zippedinfo); 
fprintfrDonelm)) 
% 测 试 是 否 无 失真 


isOK = isequal(data(:)unzipped()) 
% 显 示 压 缩 效 果 他 ) 
whos data zipped unzipped 
60969696969696969696 norm2hu 作 9%6969696969696909090 
fonction [zipped,info] = norm2huffvector) 
这 ~isa(vector'uint8 )， 
error(input argument must be a uint8 vector) 
end 
Vector = vector() 
% 将 输入 向 量 转 换 为 行 向 量 
f= frequency(vector; 
% 计 算 各 元 素 出 现 的 概率 
simbols = find( 人 一 0); 
f= fsimbols); % 将 元 素 按照 出 现 的 概率 排列 
[fsortindex] = sort(D; 
simbols = simbols(sortindex); 
% 产 生 码 字 generate the codeword as the 52 bits of a double 
len = length(simbols); 
simbols_index = num2cell(l:len); 
codeword tmp = celldlen,1); 
while length(D>1， 
indexl = simbols_indexf1}; 
index2 = simbols_index{23; 
codeword_tmp(index1) = addnode(codeword_tmp(indexl)uint8(O)); 
codeword_tmp(index2) = addnode(codeword_tmpindex2)uint8C1); 
f= [sum( 人 1:2)) 信 3:end)]; 
simbols_ index = [{[indexl index2]} simbols_index(3:end)]; 
% 将 数据 重新 排列 ,使 两 个 节点 的 频率 尽量 与 前 一 个 节点 的 频率 相当 
resort data in order to have the two nodes with lower frequency as 
firstto 
[fsortindex] = sort(D); 
simbols_index = simbols_index(sortindex); 
end 
% 对 应 相应 的 元 素 与 码 字 
codeword = cell(256:1); 
codewordGsimbols) = codeword_ tmp; 
% 计 算 总 的 字符 串 长 度 
len=0; 
for index=l:length(vector)， 
len = len+length(codewordfdouble(vector(index))+1}) 
end 
%% 产 生 01 序列 


string = repmat(uint8(O),l,len); 


<21 





22> 








code = codeword fdouble(vector(index))+1}; 
len = lengthtcode); 
string(pointer+(0:len-1)) = code; 

pointer =pointerrlen; 


end 
% 如 果 需 要 ,加 零 
len = length(string); 
pad = 8-modllen.8); 
计 pad>0， 

string =[string unit8(zeros(1,pad))]; 
end 
% 保 存 实 际 有 用 的 码 字 
codeword =codeword(simbols); 
codelen =Zeros(size(codeword)); 
weights = 2. 人 (0:23); 
maxcodelen = 0; 
forindex 1l:length(codeword)， 

len = length(codewordfindex》); 

让 len>maxcodelen, 





maxcodelen = len; 
end 
ilen>0， 
code = sum(weights(codewordfindexj= =1D); 
code =bitsettcodeen+1); 
codewordfindex} = code; 
codelen(index) = len; 
end 
end 
codeword = [codewordf: 
% 计 算 压 缩 后 的 向 量 
cols = length(string)/8; 
shape(string,8,cols); 
weights = 2. 人 (0:7); 
zipped = unit&(weights*double(string)); 
% 存 储 一 个 稀 下 矩 阵 
huffeodes = sparse(1,1); % init sparse matrix 
forindex = l:numel(codeword)， 
huffeodes(codewordfindex),1) = simbols(index); 
end 
% 产 生 信息 结构 体 
info.pad = pad; 
info ratio = colsJlength(vector; 
infolength = length(vector; 
info.maxcodelen = maxcodelen; 


strinl 














本 
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6969696969696969696 addnode 96969696969696969096 
function codeword_new = addnode(codeword_old,item) 
codeword_new = cellsize(codeword_old)); 
forindex =1:length(codeword_old)， 
codeword_newfindex} = [item codeword_oldfindexj]; 人 ) 
end 
9%696969696969696 。 huff2norm 969696969696969696969696 
function vector =huff2norm (zipped,info) 
% HUFF2NORM Huffman 解码 器 
% HUFF2NORM(X,INFO) 根 据 信 息 结构 体 info 返回 向 量 zipped 的 解码 结果 % 
% 和 托 阵 参数 以 X(:) 形 式 输入 
证 ~isazippedvunits)， 
errorinput argument must be a unit vector) 
end 
% 产 生 01 序列 
len = length(zipped); 
string =repmat(uints(O),1,len.y8); 
bitindex = 1:8; 
forindex = l:len， 
string(bitindex+8.*(index-D) = uintS(biteget(zipped(index),bitindex)); 


end 
%% 调 整 字符 串 
string = logical(string(:)7; 9% make a row of it 





len = length(string); 

string (len-info.pad+1):end) 一 []; % remove 0 padding 
len = length(string); 

% 解 码 

weights = 2.A(0:.51; 

vector =repmat(uint8(0),l,info.length); 

vectorindex 
codeindex 
code= 0; 








forindex = 1l:len, 
code = bitset(code,codeindex,string(index)); 
codeindex = codeindex+1; 
byte = decode(bitset(code,codeindex),info); 
计 byte>0, % 
Vector(vectorindex) = byte-1; 
codeindex = 1; 
code= 0; 
vectorindex = vectorindex+1; 





end 

end 

96969696969696969696969696 。 decode 96969696969696969696 
function byte = decode(code,info) 

byte = info.huffcodestcode); 








36096969096909696969090909696 位 equency 9%6909696969096969690 
function f= frequency(vector) 

%FREQUENCY 计算 元 素 出 现 概率 

让 ~isa(vectorvuint8), 


error(input argument must be a uintg vector) 
end 
f= repmat(0,1,.256); 
% 扫 描 向 量 
len = length(vectorj; 
for index =0:256, % 
人 index+l) = sum(vector==uint8(index)); 
end 
% 归 一 化 
f= fylen; 


运行 上 述 程序 ， 得 到 结果 为 


>>whos 
Name Size Bytes Class 
data 。 256X256 65535 uintg array 
unzipped 。 65535 65535 uintg array 
zipped 57712 57712 uintg array 


Grand total is 65536 elements using 65536 bytes” 
其 中 压缩 的 信息 结构 体 info 为 

Pad:7 

Huffeodes:[108471 double] 

Ratio:0.8806 


Length:65535 
Maxcodelen:16 


在 2.2.3 节 中 已经 说 明 ， 哈 夫 曼 编码 使 用 整数 个 二 进 制 位 对 符号 进行 编码 ， 这 种 方法 在 
许多 情况 下 无 法 得 到 最 优 的 压缩 效果 。 假 设 某 个 字符 的 出 现 概率 为 0.8， 该 字符 事实 上 只 需 
要 -log>(0.8)0.322 位 编码 ， 但 哈 夫 曼 编码 一 定 会 为 其 分 配 一 位 0 或 一 位 1 的 编码 。 可 以 想 
象 ， 整 个 信息 的 80% 在 压缩 后 都 几乎 相当 于 理想 长 度 的 3 倍 左右 ， 压 缩 效 果 可 想 而 知 。 

难道 真 的 能 只 输出 0.322 个 0 或 0.322 个 1 吗 ? 算术 编码 就 实现 了 这 样 的 编码 ， 而 且 自 
述 编码 在 图 像 数 据 压缩 标准 〈 如 了 了 EG、H.264 等 ) 中 扮演 了 重要 的 角色 。 

在 算术 编码 中 ， 消 息 用 0 一 1 之 间 的 实数 进行 编码 ， 算 术 编 码 用 到 两 个 基本 的 参数 : 符 
号 的 概率 和 它 的 编码 间隔 。 信 源 符 号 的 概率 决定 压缩 编码 的 效率 ， 也 决定 编码 过 程 中 信 源 符 
号 的 间隔 ， 而 这 些 间 隔 包含 在 0 一 1 之 间 。 编 码 过 程 中 的 间隔 决定 了 符号 压缩 后 的 输出 。 下 
面 以 一 个 简单 的 例子 说 明 算 术 编 码 的 编码 过 程 。 

假设 信 源 符号 为 {00,01,10,11}， 这 些 信 源 符号 的 概率 分 别 为 {0.1,0.4,0.2,0.3}。 根 据 这 些 概 
率 可 把 间隔 [0.0) 分 成 4 个 子 间隔 : [oo.D),[0.1.0.5),[0.5.0.7),[07.0， 其 中 [x, 切 表示 半 开 放 间隔 ， 

















即 包含 x 不 包含 y， 见 表 2-2。 
表 2-2 ， 信 源 符号 、 概 率 和 初始 编码 间隔 

















区 :- 簿 00 01 10 11 
概率 041 04 02 03 
初始 编码 间隔 [oo [0.1.0.5] [0.5.07] [o7.] 








如 果 二 进 制 消息 序列 的 输入 为 : 10 00 11 00 10 11 01。 编 码 时 首先 输入 的 符号 是 10， 找 
到 它 的 编码 范围 是 [0.5,0.7) 。 由 于 消息 中 第 二 个 符号 00 的 编码 范围 是 [0,0.0) ， 因 此 它 的 间隔 
就 取 [0.5.0.7) 的 第 一 个 十 分 之 一 作为 新 间隔 [0.5,0.52) 。 依 此 类 推 ， 编 码 第 三 个 符号 是 11 时 取 
新 闻 隔 为 [0.514,0.52) ， 编 码 第 四 个 符号 是 00 时 ， 取 新 闻 隔 为 [0.514,0.5146) ，…。 消息 的 编 
码 输出 可 以 是 最 后 一 个 间隔 中 的 任意 数 。 整 个 编码 过 程 如 图 2-6 所 示 。 


编码 间隔 
07 052 0.52 0.5146 051442 0.514402 












0 05 05 05I4 0514 05143 0514384 ”05143876 输出 
输入 I0 00 1 00 10 11 01 


图 2-6 算术 编码 过 程 


根据 以 上 例子 ， 算 术 编 码 可 以 总 结 如 下 。 

算术 编码 的 基本 思想 是 : 算术 编码 不 是 将 单个 信 源 符号 映射 成 一 个 码 字 ， 而 是 把 整个 信 
源 表示 为 实数 线 上 的 0 一 1 之 间 的 一 个 区 间 ， 其 长 度 等 于 该 序列 的 概率 ， 再 在 该 区 间 内 选择 
一 个 代表 性 的 小 数 ， 转 换 为 二 进 制作 为 实际 的 编码 输出 。 消 息 序列 中 的 每 个 元 素 都 要 用 来 缩 
短 这 个 区 间 。 消 息 序列 中 元 素 越 多 ， 所 得 到 的 区 间 就 越 小 ， 当 区 间 变 小 时 ， 就 需要 更 多 的 数 
位 来 表示 这 个 区 间 。 

由 此 可 得 ， 采 用 算术 编码 每 个 符号 的 平均 编码 长 度 可 以 为 小 数 。 

在 算术 编码 中 需要 注意 的 几 个 问题 : 

1) 由 于 实际 中 的 计算 机 的 精度 不 可 能 无 限 长 ， 运 算 中 出 现 溢出 是 一 个 明显 的 问题 ， 但 
多 数 机 器 都 有 16 位 、32 位 或 者 64 位 的 精度 ， 因 此 这 个 问题 可 使 用 比例 缩放 的 方法 解决 。 

2) 算术 编码 器 对 整个 消息 只 产生 一 个 码 字 ， 这 个 码 字 是 在 间隔 [0.0) 中 的 一 个 实数 ， 因 
此 译 码 器 在 接收 到 表示 这 个 实数 的 所 有 位 之 前 不 能 进行 译 码 。 

3) 算术 编码 也 是 一 种 对 错误 很 敏感 的 编码 方法 ， 如 果 有 一 位 发 生 错 误 将 导致 整个 消息 
详 错 。 

算术 编码 可 以 是 静态 的 或 者 自 适应 的 。 在 静态 算术 编码 中 ， 信 源 符号 的 概率 是 固定 
的 。 在 自 适应 算术 编码 中 ， 信 源 符 号 的 概率 根据 编码 时 符号 出 现 的 频繁 程度 动态 地 进行 修 
改 ， 在 编码 期 间 估算 信 源 符号 概率 的 过 程 叫做 建 模 。 由 于 很 难事 先知 道 精确 的 信 源 概率 ， 
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所 以 需要 开发 自 适 应 的 算术 编码 。 当 压缩 消息 时 ， 不 能 期 待 一 个 算术 编码 器 获得 最 大 的 效 
率 ， 所 能 做 的 最 有 效 的 方法 是 在 编码 过 程 中 估算 概率 。 因 此 动态 建 模 就 成 为 确定 编码 器 压 
缩 效 率 的 关键 。 
下 面 将 算术 编码 的 MATLAB 实现 程序 列举 如 下 。 
程序 如 下 : 


clear all 


26> 








format long e; 
symbol=[abcd]; 
ps=[0.4 0.2 0.1 0.3]; 
inseq=(dacaby; 
codeword=suanshubianma(symbolps,inseq) 
outseq = suanshujiema(symbol,ps,codeword,length(inseq)) 
% 算 术 编码 函数 suanshubianma 
function acode=suanshubianma(symbolps,inseq) 
high_range=[]; 
fork=l:length(ps) 
high_range=[high_range sum(ps(1:k))]; 
end 
low_range=[0 high_range(l:lengthtps-1D))]: 
sbidx=zeros(size(inseq)); 
fori=1l:length(inseq); 
sbidx(D)=find(symbol=-inseq(i); 





fori=l:length(inseq); 
range=high-low; 
high=low+range*high_range(sbidx(i); 
low=low+range*low_range(sbidx(i); 
end 
acode=low; 
% 算 术 解码 函数 
fonction symbos=suanshujiema(symbolpscodeword,symlen) 
format longe 
high_range=[]; 
fork=l:length(ps) 
high_range=[high_range sum(ps(1:KD))]; 
end 
low_range=[0 high_range(1:length(ps)-1)]; 





idx=max(find(low_range<=codeword)); 
codeword=codeword-low_rangefidx); 
ifabs(codeword-ps(idx))<0.01*psmin 








idx=idx+1; 
codeword=0; 
end 
symbos=[symbos symbol(idx)]; 
codeword=codeword/ps(idx); 
ifabs(codeword)<0.01*psmin 
isymlen+1l; 


end 
end 
运行 结果 为 
codeword=7.73920000000000le-001 
outseq=dacab 


ES 行程 编码 | 


计算 机 生成 的 图 像 往 往 有 许多 颜色 相同 的 图 片 ， 在 这 些 图 片 中 ， 许 多 连续 的 扫描 都 具有 
同一 种 颜色 ， 或 者 同一 扫描 行 中 有 许多 连续 的 像素 都 具有 同样 的 颜色 值 。 这 种 情况 下 ， 只 需 
要 存储 一 个 像素 及 具有 相同 颜色 的 像素 的 数目 即 可 ， 这 种 编码 方法 称 为 行程 编码 〔〈Rum 
Length Encoding )。 

把 具有 相同 灰 度 值 〈 颜 色 值 ) 的 一 些 像素 序列 称 为 一 个 行程 。 

对 于 简单 的 灰 度 图 像 ， 行 程 编码 的 数据 结构 表示 见 表 2-3。 


表 2-3 ”行程 编码 数据 结构 
相同 像素 起 始 华 标 | 像素 的 灰 度 值 


人 k 放 ee 
行程 长 度 隐 含 在 起 始 坐标 中 ， 不 必 单 独 列 出 。 
下 面 通过 一 段 MATLAB 程序 段 ， 对 行程 编码 的 实现 方法 进行 说 明 ， 和 希望 能 使 读者 对 行 
胆 编码 有 更 清楚 的 理解 。 在 这 里 ， 将 以 如 图 2-7 所 示 的 原始 图 像 为 例 进行 分 析 。 

程序 代码 示例 如 下 : 

clear 

记 imread('ipears.png ); 

imshow(D); 

TY=im2bw(L.0.5); 

figure,imshow(IY) 

[m nj=sizedY); 

c=IY(LD;E(LL3)[L1 e; 

二 1 








fork=lm 
forj=l:n 
inot(and(k= =1j==1D)) 
这 not(l(kj) 一 ce) 
Enew(b1:3)=[kj ICkj)]; 
ci(kj); 








ttHl; 
end 
end 
end 
end 


执行 程序 后 效果 如 图 2-8 所 示 。 








图 2-7 原始 图 像 图 2-8 二 值 化 图 像 


原 图 像 -pears.png， 大 小 为 IGRAY=486x732 字 节 =355752 字 节 ， 而 行程 编码 的 输出 数 
组 E 为 197187x3 字 节 =591561 字 节 ， 比 原来 图 像 占 用 的 存储 空间 还 要 大 ， 可 见 压缩 效果 并 
不 好 。 

如 果 首 先 对 原始 图 像 进行 二 值 化 ， 得 到 二 值 图 像 如 图 2-8 所 示 。 

运行 同样 的 程序 ， 将 输入 图 像 替换 为 二 值 化 图 像 ， 则 行程 编码 后 的 输出 结果 为 54700x3 
字 节 =164100 字 节 ， 而 二 值 化 后 的 图 像 占 用 的 存储 空间 依然 为 486x732 字 节 =355752 字 节 ， 
压缩 比 为 164100/355752=0.46， 相 对 原始 图 像 的 压缩 ， 压 缩 效 果 比 较 好 。 由 此 也 说 明 ， 行 程 
编码 对 于 仅 包含 很 少 几 个 灰 度 级 的 图 像 ， 特 别 是 二 值 图 像 ， 非 党 有效。 特别 地 ， 该 编码 方法 
村 有 单一 颜色 背景 下 物体 的 图 像 ， 具 有 更 高 的 压缩 比 。 对 于 其 他 类 型 的 图 像 压缩 ， 其 压缩 比 
较 低 ， 甚 至 在 最 坏 的 情况 下 ， 如 图 像 的 每 一 个 像素 都 与 它 周围 的 像素 不 同 ， 行 程 编码 
CRLE) 甚至 可 将 文件 的 大 小 加 倍 ， 达 不 到 编码 压缩 的 目的 。 

因为 这 里 是 无 失真 编码 ， 所 以 反 编码 后 的 图 像 与 原 图 像 是 一 样 的 ， 只 能 以 编码 后 占用 的 
存储 空间 来 进行 算法 的 比较 ， 所 以 在 上 面 只 列 出 了 编码 前 后 图 像 占 用 空间 的 大 小 s 


2.3 ”预测 编码 


预测 编码 〈Predictive Coding) 是 指 依据 某 一 模型 ， 根 据 以 往 的 样本 值 对 于 新 样本 值 进 
行 预测 ， 然 后 将 样本 的 实际 值 与 预测 值 相 减 得 到 一 个 误差 值 ， 对 这 一 误差 值 进行 编码 。 如 果 
模型 足够 好 且 样 本 序列 在 时 间 和 空间 上 存在 较 强 的 相关 性 ， 那 么 误差 信号 的 幅度 将 远 远 小 于 
信 源 原始 信号 ， 从 而 可 以 用 较 少 的 电 平 量 对 其 差 值 量化 得 到 较 大 的 数据 压缩 结果 。 
分 为 线性 预测 和 非 线 性 预测 两 类 。 

能 找到 一 个 数学 模型 可 以 完全 代表 数据 源 ， 那 么 在 接收 端 就 能 依据 这 一 数学 模型 准确 
无 误 地 产生 出 这 些 数据 。 但 没有 一 个 实际 的 系统 能 找到 其 完全 准确 的 数学 模型 ， 因 此 ， 最 好 
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的 办 法 是 采用 预测 器 以 某 种 最 小 化 的 误差 方法 对 下 一 个 样本 进行 预测 。 

1. DPCM 的 工作 原理 

在 线性 预测 中 ， 最 常用 的 是 差分 脉冲 编码 调制 ， 即 DPCM 〈Differential Pulse Code 
Modulation)。Oliver 在 1952 年 对 图 像 线性 预测 进行 了 理论 研究 ，1958 年 ，Graham 用 计算 机 
进行 了 DPCM 模拟 。DPCM 的 工作 原理 如 图 2-9 所 示 ， 主 要 是 基于 图 像 中 相 邻 像素 间 的 数 
据 具 有 较 强 的 相关 性 ， 每 个 像素 可 以 根据 以 前 已 知 的 几 个 像素 值 进 行 预测 。 在 DPCM 编码 
中 ， 编 码 和 传输 的 不 是 像素 值 本 身 ， 而 是 这 个 取样 值 的 预测 值 。 

其 中 ，xxw 为 因 时刻 的 亮度 取样 值 ， 加 为 预测 器 根据 zw 时 刻 之 前 的 样本 值 
,9 对 xw 所 做 的 预测 值 ，ex 为 差 值 信号 ， 

er Tv 一 (2-13) 









































图 2-9 DPCM 系统 原理 框图 





量化 器 对 ew 进行 量化 得 到 ev ， 编 码 器 对 ev 进行 编码 。 接 收 端 解码 时 的 预测 过 程 与 发 送 端 
相同 ， 所 采用 的 预测 器 也 相同 。 接 收 端 恢复 的 输出 信号 xw 是 xx 的 近似 值 ， 两 者 的 误差 为 
Arv =xzv (fr+ev)=xw- 芍 =ey 一 ay (2-14) 


当 Axw 足 够 小 时 ， 输 入 信号 xv 和 DPCM 系统 的 输出 信号 区 接近 一 致 。 


2. 线性 预测 编码 

在 图 像 信 源 数据 序列 中 ， 由 xm,z,xw 对 xx 进行 预测 。 由 于 是 对 xx 进行 线性 预 
测 ， 令 xxw 的 预测 值 (估计 值 ) 为 &w ， 则 如 是 交 ,z,z xzv- 的 线性 组 合 。 

设 二 维 图像 信 号 x(f) 是 均值 为 零 、 方 差 为 的 平稳 随机 过 程 ， xD) 在 生 PGv…tv- 时 
刻 的 抽样 值 分 别 为 %,x,z，…xwi， 那 么 xw 时 刻 抽样 的 线性 预测 值 为 








站 
总 =0x ao 上 0 二 0 二 和 二 GEv-l (2-15) 
邱 


式 中 ， 为 预测 系数 ， 即 待定 常数 。 
若 各 上 确定， 则 可 以 根据 上 式 构成 线性 预测 器 。 根 据 线性 预测 定义 ，fy 应 非常 逼近 
xy ， 这 就 要 求 各 w 为 最 佳 系数 。 采 用 均 方 误差 最 小 的 准则 ， 可 求 得 各 最 佳 的 系数 。 
现 定义 xy 的 均 方 误差 为 
Et[evP}= Exev 一 名 了 (2-16) 


攻 





为 使 E{[ev]} 最小， 对 式 〈2-16) 微分 可 得 


e B 贞 
ev = 一 各) 


三 放风 一 (aa +azzp 十 G 芒 十 … 十 GN_IEN_} (2-17) 


-2E{Ev 一 (Co 二 十 @9 与 十 二 GE ]} 
式 中 ，i=12,3…,N-1。 


根据 极 值 条 件 ， 可 得 如 下 N -1 个 线性 方程 ; 
EL 一 (oa 二 0 十 0 为 二 十 Gw-Ew-D2]=0 
ELPov (oo 二 ao 十 Qv-Ev-Dz] 一 0 
E{[ev -(oom +am +az+…+avwxvDe]i=0 (2-18) 





EDov 一 (oo + + + +Gv-IXw-Dxw-=0 
该 方程 组 可 表示 为 
BEPov 一 (oo + 十 Go 二 二 av-ov-Dx5] =0 
式 中 ，i=12,3…,N-1。 
令吉 和 攻 的 协 方差 为 
及 =Bozi) 57=1235N=I (2-19) 
则 上 式 可 以 表示 为 
AI 
Ru = 闷 auRu=aiRi+aaiRr 二 GaiRi 二 二 QUO 02-20) 


扎 

若 所 有 的 协 方差 及 已 知 或 可 以 测 出 时 ， 则 通过 上 式 可 计算 出 -1 个 预测 系数 。 

综 上 所 述 ， 可 以 得 出 以 下 几 点 结论 ; 

1) 预测 模型 的 复杂 程度 取决 于 线性 预测 中 使 用 以 前 的 样本 数目 ， 样 本 点 越 多 ， 则 预测 
器 越 复杂 ， 最 简单 的 预测 仅 使 用 前 一 个 样本 点 ， 称 为 前 值 预测 。 

2) 若 采用 x 的 同一 行 中 xw 的 若干 已 知 像素 样本 值 ， 如 国 
测 ， 则 称 为 一 维 预 测 。 

3) 若 采 用 同一 行 及 前 几 行 内 的 已 知 像素 样本 值 来 预测 zwv， 则 称 为 二 维 预 测 。 

4) 若 采用 的 已 知 像素 不 仅 是 前 几 行 的 ， 而 且 还 包括 前 几 帧 的 ， 那 么 则 称 为 三 维 预 


xw-1 来 对 xw 进行 预 





测 。 

图 2-10 所 示 是 一 个 简单 的 、 在 JPEG 无 损 编码 方案 中 采用 的 实际 预测 器 ， 它 给 出 了 静 
止 图 像 的 一 个 完整 的 二 维 预测 器 。 它 只 考虑 临近 3 点 4、B 和 C 的 值 ， 例 如 ， 以 4、B 或 C 
作为 了 的 预测 值 ， 则 线性 预测 方法 见 表 2-4。 





表 2-4 Y 的 预测 值 方法 








预测 方 法 | 0 | 1 | 2 3 4 | 5 | 6 凡 
预测 值 六 | 预测 | 4 | 8 6 448-C | 深 芝 | 2 























30>| 


























图 2-10 预测 器 的 组 成 


3、 非 线性 预测 
线性 预测 编码 的 基础 和 前 提 是 将 整个 图 像 域 视 为 一 个 平稳 随机 过 程 ， 其 自 相关 系数 与 像 
素 在 图 像 信 源 数据 域 中 的 位 置 无 关 。 而 实际 上 ， 图 像 的 起 伏 变化 是 始终 存在 的 ， 被 描述 的 像 
素 和 周围 像素 之 间 存 在 多 种 多 样 的 关系 。 线 性 预测 系数 是 一 种 近似 条 件 下 的 常数 ， 它 忽略 了 
不 同 像素 之 间 的 个 性 条 件 ， 因 此 存在 一 些 不 足 之 处 。 
非 线性 预测 针对 线性 预测 的 不 足 ， 充 分 考虑 了 图 像 的 统计 特性 和 图 像 信 源 数据 的 个 别 变 
化 情况 ， 即 力求 使 预测 系数 与 图 像 的 实际 局 部 特性 相 -一致 ， 通 过 使 预测 系数 随 预测 条 件 变 
化 ， 从 而 进一步 提高 压缩 编码 的 性 能 。 


2.4 图 像 的 变换 编码 


变换 编码 主要 包括 DFT 变换 、K-L 变换 、WHT 变换 、DCT 变换 和 小 波 变换 编码 等 ， 变 
换 编 码 因 其 独特 的 编码 效果 ， 已 经 成 为 一 种 得 到 广泛 应 用 的 图 像 压 缩编 码 方法 。 

1 变换 编码 的 基本 原理 

图 像 变 换 编 码 的 基本 原理 是 将 空域 中 描述 的 图 像 数据 经 过 某 种 变换 ， 如 DFT 变换 、 
DCT 变换 、K-L 变换 等 二 维 正 交 变 换 ， 转 换 到 新 的 变换 域 中 进行 描述 ， 在 变换 域 中 达到 改变 
能 量 分 布 的 目的 ， 将 图 像 能 量 在 空间 域 的 分 散 分 布 ， 变 为 在 变换 域 中 的 相对 集中 分 布 ， 从 而 
实现 对 信 源 图 像 数 据 的 有 效 压 缩 。 

变换 编码 的 基本 流程 如 图 2-11 所 示 ， 图 像 数据 经 过 某 种 变换 、 量 化 和 编码 〈 通 常 为 变 
长 编码 ) 后 由 信道 传输 到 接收 端 ， 接 收 端 进行 相反 的 处 理 ， 即 变 长 解码 、 反 量化 以 及 逆 变 
换 ， 然 后 输出 原 图 像 数据 。 


输入 过 了 
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图 2-11 变换 编码 、 解 码 工作 流 图 
图 像 数据 经 过 正 交 变换 后 ， 空 域 中 的 总 能 量 在 变换 域 中 得 到 保持 ， 但 能 量 将 会 重新 分 
布 ， 并 集中 在 变换 域 中 少数 的 变换 系数 上 ， 以 达到 压缩 数据 的 目的 。 
2. 正 交 变 换 的 物理 意义 
通常 情况 下 ， 变 换 编码 都 会 选择 正 交 变换 ， 正 交 变换 是 一 种 数据 处 理 手段 ， 它 将 被 处 理 
的 图 像 信 源 数据 按照 正 交 变 换 规则 映射 到 另 一 个 域 进行 处 理 。 由 于 图 像 是 以 二 维 矩阵 表示 
的 ， 所 以 在 图 像 编码 中 多 采用 二 维 正 交 变 换 形 式 。 图 像 数据 正 交 变换 后 不 改变 信 源 的 箭 值 ， 
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变换 前 后 图 像 的 信息 量 没 有 损失 ， 完 全 可 以 通过 对 应 的 逆 变 换 得 到 原来 的 图 像 数据 。 但 统计 
分 析 表 明 ， 经 过 正 交 变换 后 ， 数 据 的 分 布 规律 发 生 了 很 大 的 改变 ， 像 素 之 间 的 相关 性 下 降 ， 
变换 系数 向 新 坐标 系 中 的 少数 坐标 点 集中 ， 一 般 集 中 于 少数 的 直流 或 低频 分 量 的 坐标 点 。 变 
换 编码 将 统计 上 高 度 相关 的 像素 所 构成 的 矩阵 通过 正 交 变换 ， 变 成 统计 上 彼此 较为 独立 ， 其 
至 达到 完全 独立 的 变换 系数 矩阵 ， 以 达到 压缩 数据 的 目的 ， 这 就 是 图 像 变换 。 

需要 指出 的 是 ， 如 果 将 整个 图 像 作为 一 个 二 维和 矩阵， 则 变换 处 理 运算 量 太 大 ， 难 以 实 
现 。 所 以 在 实际 应 用 中 ， 先 将 一 幅 图 像 分 割 成 若干 小 的 图 像 子 块 ， 如 8x8 或 16x16 个 方 
块 ， 各 图 像 子 块 的 像素 值 都 可 以 被 看 成 一 个 二 维 数据 矩阵 ， 变 换 是 以 这 些 图 像 子 块 为 单位 
进行 的 。 

3. 变换 类 型 与 子 块 大 小 的 选择 

根据 数字 信号 处 理 理论 ， 所 有 正 交 变换 中 以 K-L 变换 性 能 最 优 ， 经 K-L 变换 后 各 变换 
系数 在 统计 上 不 再 相关 ， 其 协 方差 矩阵 为 对 角 和 矩阵 ， 因 而 大 大 减 小 了 图 像 原 始 数据 的 宛 余 
度 。 因 此 ，K-L 变换 能 完全 消除 图 像 子 块 内 像素 间 的 相关 性 ， 若 舍弃 一 些 特征 值 较 小 的 变换 
系数 ， 那 么 所 引起 的 均 方 误差 是 所 有 正 交 变换 中 最 小 的 。 由 于 K-L 变换 是 以 原始 图 像 各 子 块 
协 方差 矩阵 的 特征 向 量 作为 变换 后 的 基 向 量 ， 因 此 K-L 变换 的 基 对 不 同 图 像 是 不 同 的 ， 与 编 
码 对 象 的 统计 特性 有 关 ， 这 种 变换 基 的 不 确定 性 使 得 K-L 变换 在 实际 应 用 中 不 太 方便 。 因 
此 ， 尽 管 K-L 变换 具有 许多 明显 的 优点 ， 但 一 般 只 用 于 进行 理论 上 的 比较 。 

DFT 变换 是 应 用 最 早 ， 且 非常 成 熟 的 变换 之 一 ， 性 能 接近 于 最 佳 ， 且 具有 快速 算法 ， 其 
不 足 之 处 在 于 图 像 子 块 的 变换 系数 在 边界 处 不 连续 而 造成 恢复 后 的 图 像 子 块 边界 也 不 连续 
( 即 存在 Gibbs 现象 )， 于 是 由 图 像 子 块 构成 的 整 幅 图 像 将 呈现 隐约 可 见 的 以 图 像 子 块 为 形 
状 的 小 块 结构 ， 影 响 了 图 像 质量 ， 一 定 程度 上 影响 了 其 应 用 。 网 

DCT 变换 是 图 像 变换 中 应 用 得 最 多 的 变换 编码 ， 其 性 能 接近 于 K-L 变换 ， 且 变换 矩阵 
与 图 像 内 容 无 关 。 根 据 DCT 变换 的 特点 ， 还 可 避免 DFT 变换 中 图 像 子 块 边界 处 产生 的 跳跃 
与 Gibbs 现象 。 此 外 ， 市 场 上 拥有 许多 基于 DFT 快速 算法 的 ASIC 芯片 ， 因 此 ，DCT 变换 
已 经 成 为 图 像 变换 编码 的 主流 。 目 前 ，JPEG、MPEG、H.263 等 国际 编码 标准 选择 采用 DCT 
变换 模块 。 

沃 尔 什 变换 与 DCT 变换 相 比 ， 其 算法 简单 ， 因 而 运算 速度 较 快 ， 适 用 于 高 速 实时 系 
统 ， 而 且 实 现 该 算法 的 硬件 结构 简单 ， 不 足 之 处 是 性 能 比 DCT 变换 要 差 。 

在 确定 变换 方式 之 后 ， 还 需要 选择 变换 块 的 大 小 。 由 于 压缩 的 依据 是 基于 子 块 内 图 像 像 
素 间 的 相关 性 ， 若 子 块 选 得 太 小 ， 则 不 利于 压缩 比 的 提高 。 理 论 上 ， 子 块 越 大 ， 计 入 的 相关 
像素 越 多 ， 压 缩 比 就 越 大 。 但 如 果子 块 过 大 ， 则 计算 量 太 大 ， 同 时 考虑 到 距离 较 远 的 像素 间 
相关 性 并 不 高 ， 实 际 上 过 大 的 子 块 对 压缩 比 的 提高 效果 反而 不 好 。 因 此 ， 图 像 变 换 中 一 般 选 
择 采 用 8x8 或 16x16 大 小 的 图 像 子 块 。 

4 变换 编码 的 实现 步骤 

根据 图 像 变 换 编 码 的 原理 以 及 如 图 2-11 所 示 的 编码 、 解 码 逻 辑 流程 ， 实 现 变换 编码 一 
般 包含 以 下 步骤 。 

(1) 原始 图 像 分 块 

根据 编码 的 具体 要 求 ， 将 图 像 划分 为 若干 Yx N 的 图 像 子 块 ， 即 
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通常 情况 下 ，N 取 值 为 8 或 16。 图 像 分 块 之 后 ， 应 同时 根据 编码 的 性 能 要 求 ， 综 合 考 
虑 相关 要 素 ， 选 择 变换 抢 阵 4 对 各 图 像 子 块 进行 相应 的 正 交 变换 。 
设 了 表示 变换 域 中 的 图 像 数据 ， 则 可 表示 为 
了 =4X (2-22) 


(2) 变换 域 采样 
根据 一 定 的 准则 ， 对 变换 域 中 的 系数 进行 合理 的 取舍 。 
(3) 系数 量化 
由 于 变换 之 后 的 系数 是 不 相关 的 ， 因 此 具有 更 大 的 独立 性 和 有 序 性 ， 利 用 量化 使 图 像 数 
据 得 到 压缩 。 量 化 是 产生 有 损 压 缩 的 原因 ， 因 此 应 选择 合适 的 量化 方法 ， 以 使 量化 失真 最 
小 。 均 方 误差 是 衡量 各 种 变换 编码 效能 的 一 个 重要 准则 。 该 准则 可 在 较 高 的 压缩 比 和 一 定 的 
允许 失真 度 之 间 寻 求 一 个 较 理想 的 、 可 用 的 变换 编码 方式 。 
方 均 误差 定义 为 





3 (2-23) 
e= 可 之 之 0 一 为) 


名 名 | 
| 式 中 ， 广 为 芒 的 量化 值 。 
| 20 世纪 50 年 代 期 间 ，Panter、Dire 和 Max 研究 了 使 单个 系数 均 方 误差 极 小 化 的 量化 方 
| 案 。 研 究 发 现 ， 如 果 蕊 的 概率 密度 函数 是 均匀 的 ， 那 么 具有 均匀 间隔 输出 的 量化 器 是 最 佳 
的 。 对 于 其 他 的 分 布 ， 使 用 非 均匀 量化 器 则 能 够 起 到 减 小 均 方 误差 的 作用 。 
(4) 解码 与 反 变换 
在 变换 编码 系统 的 接收 端 对 所 接收 的 比特 流 进行 解码 ， 分 离 出 各 变换 系数 广 ， 并 进行 
系数 的 舍 入 ， 被 舍弃 的 系数 均 以 0 代替 ， 并 进行 道 变换 运算 ， 恢 复 各 图 像 子 块 及 整 由 图像。 


2.5 数据 压缩 编码 的 国际 标准 


在 多 媒体 应 用 中 ， 视 频数 据 量 方面 可 压缩 的 信息 量 最 多 ， 而 压缩 处 理 后 视频 质量 的 高 低 
1 则 是 决定 多 媒体 服务 质量 好 坏 的 主要 因素 ， 因 此 视频 压缩 技术 是 多 媒体 应 用 的 核心 技术 。 
5 在 学 术 和 应 用 领域 ， 众 多 研究 人 员 都 致力 于 视频 压缩 技术 的 研究 ， 并 且 制 定 了 几 个 标 
准 ， 如 卫 EG、MPEG 和 H.261 标准 等 。 这 些 标准 覆盖 了 较 大 的 视频 范围 和 应 用 领域 ， 支 持 
不 同 速率 、 不 同 图 像 质量 要 求 、 不 同 复杂 度 、 容 错 性 和 实时 性 的 视频 业务 ， 能 够 满足 包括 电 
视 会 议 、 视 频 电子 邮件 、 可 视 电 话 、 广 播 级 视频 应 用 等 不 同 要求 的 服务 。 随 着 视频 应 用 需求 
的 不 断 发 展 ， 视 频 压缩 技术 也 有 了 很 大 的 提高 ， 新 出 现 的 压缩 标准 有 了 更 高 的 压缩 效率 〈 在 
相同 图 像 质量 下 需要 更 低 的 传送 码 率 或 在 相同 传输 速率 下 提供 质量 更 好 的 图 像 )， 同 时 支持 
各 种 传输 速率 以 适应 不 同 的 传送 网 络 需求 。 























下 面 将 对 卫 EG 标准 和 MPEG 标准 进行 介绍 。 


了 JPEG 标准 


JPEG (Joint Photographic Experts Group) 是 一 个 由 ISO 和 IEC 两 个 组 织 机 构 联 合 组 成 的 
专家 组 ， 贫 资 制定 静态 和 数字 图 像 数 据 压 缩编 码 标准 ， 这 个 专家 组 开发 的 算法 称 为 JPEG 算 
法 ， 并 且 成 为 国际 上 通用 的 标准 ， 因 此 又 称 为 卫 EG 标准 。JPEG 是 一 个 适用 范围 很 广 的 静态 
图 像 数据 压缩 标准 ， 既 可 用 于 灰 度 图 像 压缩 又 可 用 于 彩色 图 像 压缩 。JPEG 专家 组 开发 了 两 种 
基本 的 压缩 算法 ， 一 种 是 以 离散 余弦 变换 DCT 为 基础 的 有 损 压 缩 算法 ， 另 一 种 是 以 预测 技术 
为 基础 的 无 损 压缩 算法 。 使 用 有 损 压 缩 算法 时 ， 在 压缩 比 为 25:1 的 情况 下 ， 压 缩 后 还 原 得 到 
的 图 像 与 原始 图 像 相 比较 ， 对 于 非 图 像 专家 很 难 找 出 它们 之 间 的 区 别 。 因 此 ， 该 压缩 技 
术 得 到 了 广泛 的 应 用 。 为 了 在 保证 图 像 质量 的 前 提 下 进一步 提高 压缩 比 ， 近 年 来 ，JPEG 专家 
组 又 制定 了 JPEG 2000《〈 简 称 卫 2000) 标准 ，JPEG 2000 与 传统 了 PEG 最 大 的 不 同 在 于 : 它 放 
弃 了 传统 了 了 EG 所 采用 的 以 离散 余弦 变换 为 主 的 区 块 编码 方式 ， 而 改 用 以 小 波 变换 为 主 的 多 解 
析 编 码 方式 。 采 用 小 波 变换 的 主要 目的 是 为 了 将 图 像 的 频率 成 分 抽取 出 来 。 

图 2-12 为 卫 EG 标准 的 基本 处 理 框图 。 

JPEG 标准 将 整个 图 像 分 成 gx8 的 图 像 子 块 ， 并 作为 二 维 离散 余弦 变换 DCT 的 输入 。 通 
过 DCT 变换 ， 把 能 量 集中 在 少数 几 个 系数 上 ， 然 后 对 这 些 系数 进行 量化 。 由 于 人 眼 对 亮度 
信号 比 对 色差 信号 更 敏感 ， 因 此 JPEG 使 用 了 两 种 量化 表 : 亮度 量化 值 和 色差 量化 值 。 此 
外 ， 由 于 人 眼 对 低频 分 量 的 图 像 比 对 高 频 分 量 的 图 像 更 敏感 ， 所 以 对 图 中 左上 角 的 量化 步 长 _ 
要 比 右 下 角 的 量化 步 长 小 。 

8X8 图 像 块 DCT 基 编 码 器 


PDCT 上 站 量化 器 上 二 编 器 | 


| 

| 下 一。 | 压 腑 图 像 数据 
可 

源 图 像 数据 















































量化 表 编 码 表 











图 2-12 JPEG 标准 的 基本 处 理 框图 


在 经 过 量化 后 ， 就 是 进行 焙 编 码 过 程 ， 将 DC 系数 进行 DPCM 编码 ， 将 AC 系数 按 Z 
形 排列 之 后 采用 RLE 编码 ， 最 后 得 到 经 压缩 编码 后 的 数据 值 。 

此 外 ，JPEG 还 规定 了 4 种 运行 模式 ， 以 满足 不 同 的 应 用 需要 。 

1) 基于 DPCM 的 无 损 编码 模式 ;压缩 比 可 以 达到 2:1。 

2) 基于 DCT 的 有 损 顺 序 编码 模式 :压缩 比 可 以 达到 10:1 以 上 。 

3) 基于 DCT 的 递增 编码 模式 。 

4) 基于 DCT 的 分 层 编码 模式 。 

下 面 ， 以 JPEG 有 损 顺 序 编码 算法 为 例 说明 如 何 利用 卫 EG 标准 进行 图 像 压 缩 。 其 主要 
的 计算 步骤 如 下 。 

1) 将 源 图 像 分 成 几 个 颜色 平面 〈 分 量 图像 )。 

2) 对 每 个 8x8 数据 块 进行 正 向 离散 余弦 变换 (FDCT)。 








34>>| 








3) 根据 表 2-5 和 表 2-6 中 的 理化 模板 系数 对 DCT 系数 进行 量化 。 
4) Z 形 排列 量化 结果 。 
5) 使 用 差分 脉冲 编码 调制 (DPCM) 对 直流 系数 (DC) 进行 编码 。 
















































































%JPEGdemo.m JPEG 算法 仿真 


% 本 程序 只 是 为 了 说 明基 本 的 JPEG 功能 


clear all 

% 待 处 理 数据 

全 [52 55 61 66 70 61 64 73 
63 59 66 90 109 85 69 72 
62 59 68 113 144 104 66 73 
63 58 71 122 154 106 70 69 
67 61 68 104 126 88 68 70 
7965 60707768 5875 
85 71 64 59 55 61 65 83 
87 78 69 68 65 76 78 94]; 

%6f 也 可 以 是 读 入 灰 度 图 像 数据 


echo on 





6) 使 用 行程 长 度 编码 (RLE) 对 交流 系数 〈AC) 进行 编码 。 
7) 炳 编码 (Entropy Coding )。 
表 2-5 亮度 的 量化 模板 系数 
16 1 10 16 24 40 5 6 
1 12 14 19 26 58 60 5 
14 1 16 24 40 57 6 56 
14 17 22 29 5 87 80 6@2 
18 22 37 56 68 109 103 77 
24 35 5 4 81 104 113 952 
49 64 78 87 103 架 10 101 
7 9 55 可 112 100 103 9 
表 2-6 颜色 的 量化 模板 系数 
17 18 24 67 9%9 99 99 99 
18 21 26 66 99 99 99 9 
24 26 56 9 99 9 99 99 
47 66 9%9 9 99 99 99 9 
9 99 99 9 9%9 9 99 9%9 
9%9 9%9 9 99 9 99 99 9%9 
99 99 99 99 99 9 99 9 
9%9 9%9 99 9 99 9%9 9%9 99 
针对 以 上 处 理 步骤 ， 以 下 的 MATLAB 程序 代码 示例 说 明了 JPEG 有 损 顺 序 编码 算法 的 
| 实现 过 程 。 





% level shift by 128 
仁 全 128; 
[mfnflj=size(D:mb=mBg:nb=nfg8; 
吧 计算 的 大 小 ， 以 及 分 块 后 的 块 数 
二 % 步 骤 一 :计算 每 个 gx8 图 像 子 块 的 离散 DCT 系数 
F 人 -blkproc(f[8 8]"dcty; 


% 对 了 的 每 个 图 像 子 块 的 列 进行 DCT 变换 apply DCT to each column ofeach block off 


F 人 -blkproc(Ff,[8 8],dct; 


% 对 ff 的 每 个 图 像 子 块 的 行进 行 DCT 变换 apply DCT to each row of each block off 


Ff-round(Ff); 
% 按 比例 量化 
Q=[1611 10 1624 405161 
12 12 14 19 26 58 60 55 
14 13 16 24 40 57 69 56 
141722 29 51 87 80 62 
18 22 37 56 68 109 103 77 
24 35 55 64 81 104 113 92 
49 64 78 87 103 121 120 101 
72 92 95 98 112 100 103 99]; 
%% 量 化 矩阵 
Fq=round(blkproc(Ff[8 8], "divq,Q));% 取 整 
echo off 
% 对 DC 系数 进行 DPCM 编码 ， 逐 行 扫描 
论 mbynb>1， 
fac=reshape(Fq(1:8:mf1:8:nD,mbsnb,1); 
他 pcm=dpcm(fdc,1); 
else 
人 pcm=Fq(1,D-(-17); 
end 
dccof[]; 
fori=l:mbsnb, 
dccof-[dccofjdcenc(fdpcmGi); 
end 
disp('Differential DC coefficienttnum2str(fdpcmJ)is encoded asz]); 
dispint2strtdccof); 
echo on 
% 之 字形 扫描 AC 系数 ， 进 行 行程 (LZW) 编码 
z[126715 162829 
3581417273043 
4913 18263142 44 
1012 192532 4145 54 
11202433 40 46 53 55 
2123 3439 47 52 5661 
223538 48 51 57 60 62 
36 37 49 50 58 59 63 64]; 
echo of 





ereceree 








forj=1:nb 
tmp(z)=Fq(8*(i-D)+1:8*i8*G-1)+1:8j); 
一 -。 %tmp 为 164 
eobi=max(find(tmp- 一 0)); 
acseq=[acseq tmp(2:eobi) 999];:%6 给 eob 赋值 999 
end 


end 
accof-jacencacseq); 
disp([ DC coefficient after Hoffman coding has'int2str(length(dccoD) 
”bits]); 
disp(['AC coefFicient after Hoffiman coding hasint2str(lengthtaccof) 
"bits]); 
得 到 结果 ; 


DC coefficient after Hoffman coding has 7 bits 
AC coefficient after Hoffman coding has 84 bits 


网 MPEG 视频 编码 压缩 标准 


从 时 间 的 观点 看 ， 数 字 图 像 分 为 静态 图 像 和 运动 图 像 ， 视 频 信号 就 是 典型 的 运动 图 像 。 
视频 压缩 的 目标 是 在 尽 可 能 保证 视觉 效果 的 前 提 下 减少 视频 数据 率 。 视 频 压 缩 比 一 般 指 压 缩 
后 的 数据 量 与 压缩 前 的 数据 量 之 比 

根据 压缩 前 和 解压 缩 后 的 数据 是 否 完全 一 致 ， 视 频 压 缩 可 分 为 有 损 压 缩 和 无 损 压缩 。 无 
损 压缩 意味 着 解压 缩 后 的 数据 与 压缩 前 的 数据 完全 一 致 。 有 损 压 缩 则 意味 着 解压 缩 后 的 数据 
与 压缩 前 的 数据 不 一 致 。 在 压缩 的 过 程 中 要 丢失 一 些 人 眼 和 人 耳 所 不 敏感 的 图 像 或 音频 信 
息 ， 而 且 丢失 的 信息 不 可 恢复 。 丢 失 的 数据 率 与 压缩 比 有 关 ， 压 缩 比 越 小 ， 丢 失 的 数据 越 
多 ， 解 压缩 后 的 效果 越 差 。 此 外 ， 某 些 有 损 压 缩 算 法 采用 多 次 重复 压缩 的 方式 ， 这 样 还 会 引 
起 额外 的 数据 丢失 。 

具体 的 视频 编码 和 解码 过 程 如 图 2-13 所 示 。 
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图 2-13 ”视频 编 解码 过 程 
a 视频 编码 b) 视频 解码 


捷 37 











图 2-14 所 示 为 视频 信号 的 压缩 过 程 ， 该 图 充分 说 明了 视频 信号 的 压缩 包括 两 个 主要 
访 面 ， 帧 内 压缩 与 帧 间 压 缩 。 帧 内 压缩 (Intraframe Compression ) 也 称 为 空间 压缩 
(Spatial Compression)， 当 压缩 一 帧 图 像 时 ， 仅 考 虑 本 帧 的 数据 而 不 考虑 相 邻 帧 之 间 的 宛 
余 信 息 , .这 实际 上 与 静态 图 像 压 缩 类 似 。 帧 内 压缩 一 般 达 不 到 很 高 的 压缩 。 帧 间 压 缩 
(Interframe Compression) 是 基于 许多 视频 或 动画 的 连续 前 后 两 帧 具有 的 相关 性 ， 或 者 说 
前 后 两 帧 信息 变化 很 小 的 特点 ， 即 连续 的 视频 其 相 邻 帧 之 间 具有 宛 余 信息 。 根 据 这 一 特 
性 ， 压 缩 相 邻 帧 之 间 的 宛 余 量 就 可 以 进一步 提高 压缩 量 ， 减 小 压缩 比 。 帧 间 压 缩 也 称 为 时 
间 压 缩 (Temporal Compression)， 它 通过 比较 时 间 轴 上 不 同 帧 之 间 的 数据 进行 压缩 。 帧 间 


压缩 一 般 是 无 损 压 缩 。 
村内 压缩 | | 帧 向 压缩 | | wpEc 多 由 
国 芝 | | 型 除 空间 | | 型 除 时 间 
抑 余 移 余 


图 2-14 视频 信号 的 压缩 过 程 


MPEG (Moving Picture Experts Group) 是 运动 图 像 专家 组 的 简称 ， 该 组 织 专门 致力 于 对 
数字 存储 媒介 中 运动 图 像 及 其 伴音 的 压缩 编码 技术 的 标准 化 和 实用 化 研究 。MPEG 是 个 国际 
标准 ， 即 ISO 11172。 该 小 组 于 1991 年 底 提出 了 用 于 数字 存储 媒介 的 、 速 率 约 为 1.5MBAs 的 
运动 图 像 及 其 伴音 的 压缩 编码 ， 并 于 1992 年 正式 通过 ， 通 常 被 称 为 MPEG 标准 ， 此 标准 后 
来 被 定名 为 MPEG-1。MPEG 与 JPEG 算法 在 概念 上 类 似 ， 只 不 过 它 还 利用 了 相继 图 像 之 间 
的 宛 余 信息 。 由 于 可 达到 100 : 1 的 压缩 比 ， 所 以 MPEG 算法 非常 实用 ， 可 用 于 在 1Mbits 
的 信道 中 传送 带 声音 的 彩色 电视 图 像 ， 以 及 在 磁盘 驱动 器 中 存储 较 长 一 段 时 间 的 数字 电视 图 
像 片段 等 。 
到 目前 为 止 ，MPEG 标准 已 不 再 是 一 个 单一 的 标准 ， 而 是 一 个 用 于 全 运动 视频 和 相关 
音频 压缩 的 标准 系列 ， 包 括 MPEG-1、MPEG-2、MPEG-3、MPEG-4 和 MPEG-7 共 5 个 标 
准 ， 每 一 个 标准 都 有 其 特定 的 应 用 范围 。 其 中 ， 它 的 两 个 标准 一 MPEG-1 和 MPEG-2 标 
准 的 应 用 范围 最 广 ， 也 特别 重要 。MPEG-1 用 于 加 速 CD-ROM 中 图 像 的 传输 。 它 的 目的 是 
把 221MBAs 的 NTSC 图 像 压缩 到 1.2MB/s， 压 缩 率 为 200 : 1。 这 是 图 像 压缩 的 工业 认可 标 
准 。MPEG-2 用 于 图 像 的 宽带 传输 ， 图 像 质量 达到 电视 广播 甚至 HDTV 的 标准 。 和 MPEG-l 
相 比 ，MPEG-2 支持 更 广 的 分 辨 率 比特 率 范围 ， 将 成 为 数字 图 像 光 盘 〈DVD) 和 数字 广播 
电视 的 压缩 方式 。 这 些 市 场 和 计算 机 市 场 交织 在 一 起 ， 从 而 使 MPEG-2 成 为 计算 机 的 一 种 
重要 的 图 像 压 缩 标准 。 这 一 点 非常 重要 ， 因 为 将 .MPEG-1 的 比特 流 解 压缩 时 需要 用 
MPEG-2 的 解压 缩 器 。MPEG-4 标准 支持 非常 低 的 比特 率 数据 流 的 应 用 ， 如 电视 电话 ， 
频 邮 件 和 电子 报刊 等 。 

MPEG 视频 压缩 分 为 空间 域 压缩 与 时 间 域 压缩 。MPEG 标准 在 空间 域 的 压缩 ， 类 似 
JPEG 标准 。 每 一 帧 被 作为 独立 的 图 像 获 取 ， 且 压缩 步骤 与 卫 EG 标准 的 步骤 一 样 。 时 间 
压缩 ， 即 帧 间 编 码 的 基本 思想 是 仅 存储 运动 图 像 从 一 帧 到 下 一 帧 的 变化 部 分 ， 而 不 是 存 
全 部 图 像 数据 ， 这 样 做 能 极 大 地 减少 运动 图 像 数据 存储 量 ， 达 到 帧 间 压 缩 的 目的 。 这 : 




















































































过 把 帧 序列 划分 成 I 帧 、P 帧 、B 帧 ， 使 用 参照 帧 及 运动 补偿 技术 来 实现 的 。 所 谓 的 工 帧 是 
在 解码 时 ， 无 需 参照 任何 其 他 帧 的 帧 ， 或 称 为 内 编码 帧 ， 它 是 利用 自身 的 相关 性 进行 帧 内 
压缩 编码 ， 而 在 帧 编码 时 仅 使 用 最 近 的 前 一 帧 〈I 帧 或 P 帧 ) 作 为 参照 帧 时 ， 该 帧 称 为 P 
帧 或 称 为 预测 帧 ， 对 于 在 帧 编码 时 要 使 用 前 、 后 帧 作为 参照 帧 时 ， 该 帧 称 为 B 帧 ， 或 称 为 
双向 预测 帧 。 


2.6 小 结 


本 章 在 分 析 图 像 编 码 的 必要 性 与 可 能 性 的 基础 上 ， 对 图 像 编 码 与 压缩 的 概念 、 理 论 
进行 了 简要 介绍 ， 并 从 无 损 压 缩 和 有 损 压 缩 的 角度 具体 介绍 了 几 种 常用 的 图 像 编 码 与 压 
缩 技术 。 

有 损 编码 是 以 丢失 部 分 信息 为 代价 来 换取 高 压缩 比 的 。 有 损 压 缩 方法 主要 有 有 损 预测 编 
码 方法 、 变 换 编码 方法 等 。 预 测 编码 是 根据 某 一 模型 利用 以 往 的 样本 值 对 于 新 样本 值 进行 预 
测 ， 然 后 将 样本 的 实际 值 与 其 预测 值 相 减 得 到 一 个 误差 值 ， 对 于 这 一 误差 值 进行 编码 。 如 果 
对 差 值 信号 不 进行 量化 而 直接 编码 ， 称 为 无 损 预 测 编码 。 如 果 不 是 直接 对 差 值 信号 进行 编 
码 ， 而 是 对 差 值 信号 进行 量化 后 再 进行 编码 ， 称 为 有 损 预 测 编码 。 有 损 预 测 方法 有 多 种 ， 其 
中 差分 脉冲 编码 调制 是 一 种 具有 代表 性 的 编码 方法 。 由 于 离散 余弦 变换 可 与 最 佳 变换 K-L 变 
换 媲 美 ， 而 计算 复杂 度 适中 ， 近 年 来 在 图 像 数据 压缩 中 ， 采 用 离散 余弦 变换 编码 的 方案 很 
多 。JPEG、MPEG、H.261 等 压缩 标准 ， 都 用 到 离散 余弦 变换 编码 进行 数据 压缩 。 

JPEG 是 联合 图 像 专家 小 组 开发 研制 的 连续 色调 、 多 级 灰 度 、 静 止 图 像 的 数字 图 像 压 
缩编 码 方法 。JPEG 中 的 核心 算法 是 DCT 变换 编码 。JPEG 采用 的 是 8x8 图 像 子 块 的 二 维 
离散 余弦 变换 。 在 编码 器 的 输入 端 ， 把 原始 图 像 顺 序 地 分 割 成 一 系列 8x8 图 像 子 块 的 64 
个 变换 系数 经 量化 后 ， 按 直流 系数 DC 和 交流 系数 AC 分 成 两 类 处 理 。JPEG 对 DC 系数 采 
用 DPCM 编码 ， 即 对 相 邻 块 之 间 的 DC 系数 的 差 值 编码 。 其 余 63 个 交流 系数 采用 行程 编 
码 。 为 了 进一步 达到 压缩 数据 的 目的 ， 可 以 对 DPCM 编码 后 的 DC 码 和 RLE 编码 后 的 AC 
码 的 码 字 再 作 灶 编码 。JPEG 建议 使 用 两 种 箭 编码 方法 : 哈 夫 曼 〈Hufftman) 编码 和 自 适应 

- 进 制 算术 编码 。 

MPEG 视频 压缩 分 为 空间 域 压缩 与 时 间 域 压缩 。MPEG 标准 在 空间 域 的 压缩 ， 类 似 于 
JPEG 标准 。 每 一 帧 被 作为 独立 的 图 像 获 取 ， 且 压缩 步骤 与 卫 EG 标准 的 步骤 一 样 。 时 间 域 
压缩 ， 即 帧 间 编 码 的 基本 思想 是 仅 存储 运动 图 像 从 一 帧 到 下 一 帧 的 变化 部 分 ， 而 不 是 存储 全 
部 图 像 数据 ， 这 样 做 能 极 大 地 减少 运动 图 像 数据 的 存储 量 ， 达 到 帧 间 压 缩 的 目的 。 它 通过 把 
帧 序列 划分 成 I 帧 、P 帧 、B 帧 ， 使 用 参照 帧 及 运动 补偿 技术 来 实现 。 


习题 
2-1 盖 述 图 像 编码 的 两 个 评价 准则 。 
2-2 DCT 系数 量化 后 ， 为 什么 需要 进行 乙 形 扫描 ? 


2-3，” 设 有 一 幅 图 像 的 8x8 图 像 子 块 的 亮度 数据 和 DCT 变换 系数 见 表 2-7 和 表 2-8， 试 
对 其 按 JPEG 基本 系统 进行 编码 。 
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17 120 109 77 73 64 54 60 
139 123 102 74 75 60 64 87 
109 100 93 85 70 68 97 403 
97 117 17 78 74 94 103 79 
164 149 88 87 99 91 74 68 
147 94 90 102 84 72 82 102 
95 92 116 119 114 122 137 150 
111 112 140 150 157 163 161 157 
表 2-8 DCT 变换 系数 表 

102 人 6 0 0 0 0 0 
-于 11 4 0 过 -2 0 0 
6 < -3 -2 0 0 0 0 
-6 8 2 2 3 0 0 0 
4 2 。 全 3 过 0 0 

2 5 世 才 -3 1 0 0 
=- 0 0 0 2 1 0 0 

1 0 0 0 0 所 1 0 























2-4 已 知 符号 a、e、i、o、u、k 的 出 现 概率 分 别 是 0.2、0.3、0.1、0.2 


对 0.23355 进行 算术 解码 。 
2-5 简 述 变换 编码 的 原理 及 过 程 。 
2-6 说 明 MPEG 中 I，P，B 帧 的 含义 。 





0.1、0.1， 请 


2-7 已 知 信 源 YX{0，1}， 信 源 符号 概率 为 P(O)=1/4，P(D)=3/4。 试 对 1001 和 10111 进行 


算术 编码 。 








第 3 章 图 像 复 原 


图 像 复原 是 图 像 处 理 的 另 一 个 重要 内 容 ， 它 的 主要 目的 是 改善 给 定 的 图 像 质量 并 尽 可 能 
恢复 原 图 像 。 图 像 在 形成 、 传 输 和 记录 过 程 中 ， 受 多 种 因素 的 影响 ， 图 像 的 质量 都 会 有 所 下 
降 ， 典 型 表现 有 图 像 模 糊 、 失 真 、 有 噪声 等 。 这 一 质量 下 降 的 过 程 称 为 图 像 的 退化 。 图 像 复 原 
《或 称 图 像 恢复 ) 的 目的 就 是 尽 可 能 恢复 退化 图 像 的 本 来 面目 。 本 章 主要 讲解 一 些 基本 的 图 像 
复原 技术 。 


3.1 图 像 复原 的 基本 概念 


无 论 是 由 光学 、 光 电 或 电子 方法 获得 的 图 像 都 会 有 不 同 程度 的 退化 。 由 于 获得 图 像 的 方 
法 不 同 ， 其 退化 形式 是 多 种 多 样 的 ， 如 传感器 噪声 、 摄 像 机 未 聚焦 、 物 体 与 摄像 设备 之 间 的 
相对 移动 、 随 机 大 气 测 流 、 光 学 系统 的 像 差 、 成 像 光源 或 射线 的 散射 、 摄 影 胶片 的 非 线性 和 
几何 畸变 等 ， 这 些 因素 都 会 使 成 像 的 分 辨 率 和 对 比 度 退化 。 如 果 对 退化 的 类 型 、 机 制 和 过 程 
都 十 分 清楚 ， 就 可 以 利用 其 反 过 程 把 已 退化 的 图 像 复原 。 图 像 复原 结果 的 好 坏 主要 取决 于 对 
图 像 退 化 过 程 的 先 验 知识 掌握 的 精确 程度 。 

对 图 像 复原 结果 的 评价 有 一 些 准则 ， 这 些 准则 包括 最 小 方 均 误差 准则 、 加 权 均 方 准则 ， 
最 大 焙 准 则 等 。 这 些 准则 是 规定 复原 后 的 图 像 与 原 图 像 相 比较 的 质量 标准 ， 也 就 是 说 ， 当 确 
定 图 像 复 原 的 质量 标准 后 ， 对 所 期 望 的 结果 做 出 符合 某 种 标准 的 最 佳 估计 。 和 典型 的 图 像 复原 
是 根据 图 像 退 化 的 先 验 知识 建立 一 个 退化 模型 ， 以 此 模型 为 基础 ， 采 用 各 种 反 退 化 处 理 方 
法 ， 如 滤波 等 ， 使 图 像 复 原 后 符合 某 些 准则 ， 图 像 质量 得 到 改善 。 

从 某 种 意义 上 说 ， 图 像 复原 和 图 像 增强 的 目的 都 是 为 了 改善 图 像 的 质量 ， 但 它们 的 技术 
思想 却 完全 不 同 ， 二 者 之 间 有 着 很 大 的 区 别 。 图 像 增强 不 考虑 图 像 是 如 何 退化 的 ， 
少 建立 模型 ， 只 通过 各 种 技术 来 增强 图 像 的 视觉 效果 ， 以 适应 人 视觉 系统 的 生理 、 4 
从 而 使 人 觉得 舒适 、 愉 悦 ， 却 很 少 涉及 客观 和 统一 的 评价 标准 。 因 些 ， 国 像 增强 洒 以 不 顾及 才 
强 后 的 图 像 是 否 符合 原 图 像 、 是 否 失真 ， 往 往 只 要 看 着 舒适 即 可 。 图 像 复 原 就 完全 不 同 ， 需 要 
知道 图 像 退 化 机 制 和 过 程 的 先 验 知识 ， 要 建立 相应 的 退化 模型 ， 据 此 找 出 一 种 相应 的 反 过 程 ， 
从 而 恢复 出 原 图 像 。 例 如 ， 未 聚焦 的 照片 ， 无 论 用 什么 增强 方法 也 不 可 能 得 到 清晰 的 诛 图 像 ， 
但 是 ， 若 已 知 其 退化 的 先 验 知识 是 镜头 不 聚焦 ， 则 其 反 过 程 可 用 一 阶 贝 塞 尔 函 数 的 反 滤 波 来 复 
原 图 像 。 另 外 ， 图 像 复 原 要 明确 规定 质量 标准 ， 以 便 对 希望 的 结果 做 出 最 佳 的 估计 。 

由 于 图 像 复原 过 程 的 特殊 性 ， 可 以 根据 不 同 的 退化 模型 和 不 同 的 质量 评价 标准 ， 推 导出 
多 种 复原 的 方法 。 

下 面 给 出 两 个 图 像 复原 的 实例 ， 以 增加 对 图 像 复 原 技术 的 直观 印象 。 图 3-1 所 示 是 巴特 
沃 斯 带 阻 滤波 器 复原 受 正弦 噪声 干扰 的 图 像 的 例子 。 可 以 看 到 ， 恢 复 后 的 图 像 效果 非常 好 ， 
即使 是 细小 的 细节 和 纹理 都 被 这 种 简单 的 滤波 方式 有 效 地 修复 了 。 
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图 3-2 所 示 是 一 个 维 纳 滤波 器 
像 已 经 模糊 不 清 ， 通 过 维 纳 滤波 





点 用 的 例子 ， 由 于 
句 恢 复出 来 的 图 像 相 


受 剧烈 大 气 






的 严重 影响 ， 获 得 的 图 
接近 原始 图 像 。 














滤波 器 应 用 





的 图 像 b) 用 维 纳 滤器 恢复 出 来 的 图 像 


3.2 图 像 退 化 模型 


图 像 复 原 处 理 的 关键 是 建立 退化 模型 ， 原 图 像 f(x,y) 是 通过 一 个 系统 卫 及 加 入 一 个 外 
来 加 性 噪声 x(x,?) 而 退化 成 一 幅 图 像 g(x,y) 的 ， 如 图 3-3 所 示 。 


mx 





Or 人) BC 














图 3-3 图 像 的 退化 模型 
图 像 复 原 可 以 被 看 成 一 个 预测 估计 的 过 程 ， 由 已 给 出 的 退化 图 像 g(x, y) 估计 出 系统 参 
数 五 ， 从 而 近似 地 恢复 出 fgx,y) 。 mx,y) 为 一 种 统计 性 质 的 信息 。 为 了 对 处 理 结果 做 出 某 
种 最 佳 估计 ， 一 般 首先 确立 一 个 质量 标准 。 复 原 处 理 的 基础 在 于 对 系统 豆 的 基础 了 解 ， 
系统 是 由 某 些 元 件 或 部 件 以 某 种 方式 构造 而 成 的 整体 。 系 统 本 身 所 具有 的 某 些 特性 就 构成 了 


















系统 的 输入 信号 与 输出 信号 的 某 种 联系 ， 这 种 联系 从 数学 上 可 以 用 算 子 或 响应 函数 hx, y) 来 

因此 图 像 退 化 过 程 的 数学 表达 式 就 可 以 写 为 

goD)=ELACc+no 们 (3-1) 

研 *] 可 理解 为 综合 所 有 退化 因素 的 函数 或 算 子 。 

抽象 地 讲 ， 在 不 考虑 加 性 噪声 x(x,?) 时 ， 图 像 退 化 的 过 程 也 可 以 被 看 成 是 一 个 变换 万 即 

五 LO 一 SC 

由 8g(CcJ) 求 得 /(x,y) ， 就 是 寻求 道 变换 万 ， 使 得 [gCoy] 一 Joe 

图 像 复原 的 过 程 ， 就 是 根据 退化 模型 及 原 图 像 的 某 些 知识 ， 设 计 一 个 恢复 系统 plx, y)， 
以 退化 图 像 sCx,y) 作为 输入 ， 该 系统 应 使 输出 的 恢复 图 像 六 xy) ， 按 某 种 准则 最 接近 原 图 
像 f(x,?) ， 图 像 退 化 与 复原 的 过 程 如 图 3-4 所 示 。 其 中 hx,y) 和 Ptx,y) 分 别称 为 成 像 系 统 
和 恢复 系统 的 冲 激 响 应 。 


Ar 


人 | 上 下 Re 
图 3-4 “图 像 退化 与 复原 的 过 程 


系统 万 的 分 类 方法 很 多 ， 可 分 为 线性 系统 和 非 线性 系统 ， 时 变 系 统 和 非 时 变 系统 ， 集 
中 参数 系统 和 分 布 参数 系统 ， 连 续 系统 和 离散 系统 等 。 
线性 系统 就 是 具有 均匀 性 和 相 加 性 的 系统 。 当 不 考虑 加 性 噪声 wx,y) 时 ， 即 令 
nx) =0， 则 图 3-3 所 示 的 系统 可 表示 为 
gx)=LAx 
两 个 输入 信号 1,、 万 (xy 对 应 的 输出 信号 为 gi(x,y) 、gs(Cxy) ， 如 果 有 
瓦 [Co 人 + 让 户 CD]= 五 [ 夺 有 GcD]+[ 态 Co 人 = 有 SICcy)+ga(c7) (3-2) 
成 立 ， 则 系统 妃 是 一 个 线性 系统 ， 厂 和 已 为 常数 。 
线性 系统 的 这 种 特性 为 求解 多 个 激励 情况 下 的 输出 响应 带 来 很 大 方便 。 
如 果 一 个 系统 的 参数 随时 间 变 化 ， 即 称 为 时 不 变 系统 或 非 时 变 系统 ， 否 则 ， 该 系统 为 时 
变 系统 。 与 此 相对 应 ， 对 二 维 函 数 来 说 ， 如 果 
Lawy-D]=Sscxc-ay-D) 53-3) 
则 已 是 空间 不 变 系 统 〈 或 称 位 置 不 变 系统 )。 式 中 ，cw 、B 分 别 是 空间 位 置 的 位 移 量 ， 表 示 
图 像 中 任 一 点 通过 该 系统 的 响应 只 取决 于 在 该 点 的 输入 值 ， 而 与 该 点 的 位 置 无 关 。 
由 上 式 可 见 ， 如 果 系统 所 有 式 (3-2) 和 式 (3-3) 的 关系 ， 那 么 系统 万 就 是 线性 和 空间 位 
置 不 变 的 系统 。 在 图 像 复 原 处 理 中 ， 非 线性 和 空间 变化 的 系统 模型 虽然 更 具有 普遍 性 和 准确 
性 ， 但 它 却 给 处 理工 作 带 来 了 巨大 的 困难 ， 它 常常 没有 解 或 很 难 用 计算 机 来 处 理 。 实 际 的 成 像 
系统 在 一 定 条 件 下 往往 可 以 近似 地 视 为 线性 和 空间 不 变 的 系统 ， 因 此 在 图 像 复 原 处 理 中 ， 往 往 
用 线性 和 空间 不 变 的 系统 模型 加 以 近似 。 这 种 近似 使 线性 系统 理论 中 的 许多 知识 可 以 直接 用 于 
解决 图 像 复 原 问题 ， 所 有 图 像 复 原 处 理 特别 是 数字 图 像 复 原 处 理 主要 采用 线性 的 空间 不 变 复原 
技术 。 

















连续 的 退化 模型 
单位 冲 激 函数 5(D) 是 一 个 振幅 在 原点 之 外 所 有 时 刻 为 零 ， 而 在 原点 处 振幅 为 无 穷 大 ， 宽 
度 无 限 小 ， 面 积 为 1 的 窜 脉 冲 ， 其 域 表 达 式 为 


mt=0 hm 
ao 2 站 sod=l (3-4) 
5(D 的 卷 积 取样 公式 为 
JoD= 站 7-D50d' (3-5) 
或 
JeD= [AGO5Cc-Dd (3-6) 


上 述 的 一 维 时 域 冲 激 函 数 5(t) 可 推广 到 二 维 空间 域 中 ， 从 而 可 把 r(x,y) 写成 下 列 形 
式 : 
Jo)= 站 站 7le.p)5C-awy-P)dadp (3-7) 
由 于 gC 芒 = HLAGoo)]+nleo)， 如 果 令 nz)=0， 同 时 考虑 到 万 为 线性 算 子 ， 则 
8 人 =LACcy)] 
= 可 记 请 re mac-wy-paeap] 
HH 《3-8) 
= 三 户 aLep)5c-wy-P)Hadp 
= 站 站 Ac.PDHI5c-wy-P)Hadp 
令 pccoysB)=HI5C-ay-P)]， 则 有 
go)= 站 六 7wP)noowmPdadp (3-9) 
式 中 ，hGesc,mD) 为 系统 万 的 冲 激 响 应 ， 即 Kx as) 是 系统 吾 对 坐标 为 (c,O) 处 的 冲 激 
函数 5(ca,m AP) 的 响应 。 在 光学 中 神 激 为 一 光 点 ， 因 此 又 将 Masa,y B) 称 为 退化 过 程 的 点 扩 
散 函 数 (PSF )。 
式 (3-9) 说 明 : 当 系 统 瑟 对 冲 激 函数 的 响应 为 已 知 ， 则 对 任意 输入 xy) 的 响应 均 可 
由 式 3-9) 求 得 。 也 就 是 说 ， 线 性 系统 刀 完 全 可 由 其 冲 激 响应 来 表征 。 
当 系 统 瓦 空间 位 置 不 变 时 ， 则 
hz-ay-D)= 瑟 [5Cxz-cx,y-D)] (3-10) 
这 样 就 有 
goD)= 站 站 7(e.p)ne-wy-P)dadp CG3-11) 
即 系统 刀 对 输入 (xy) 的 响应 就 是 系统 输入 信号 F(x,y) 与 系统 冲 激 响应 的 卷 积 。 
考虑 加 性 噪声 mx,) 时 ， 式 (3-9) 可 写成 
gooD)= 站 站 Tcp)noamBdad6+ncD) 53-12) 
式 中 ，nCey) 与 图 像 中 的 位 置 无 关 。 








鲍 高 散 的 退化 模型 


在 连续 的 退化 模型 中 ， 把 fa,P) 和 Hzx- wy- B) 进行 均匀 取样 后 就 可 引伸 出 离散 的 退 


推广 到 二 维 。 


化 模型 。 为 了 更 好 地 理解 离散 的 退化 模型 ， 我 们 首先 用 一 维 函 数 来 说 明 其 基本 概念 ， 然 后 再 这 


设 有 两 个 函数 f(x) 和 ACz) ， 它 们 被 均匀 取样 后 分 别 形成 长 度 为 4 筷 的 一 维 矩 阵 ， 于 
是 7(z) 变 成 在 x=0,12,…,4-1 范 围 内 的 离散 变量 ，AMzx) 变 成 在 x= 0.1.2,…,B -1 范围 内 的 
离散 变量 ， 于 是 ,f(xz) 和 ACx) 的 连续 卷 积 关系 就 变 成 离散 卷 积 关系 。 
若 (xz) 和 AHCx) 都 是 周期 为 N 的 序列 ， 那 么 ， 它 们 的 时 域 离散 卷 积 定义 为 
和 7 x= 012…,N (3-13) 


oo 


则 8(Cx) 也 是 周期 为 X 的 序列 ， 周 期 卷 积 可 以 用 常规 卷 积 法 计算 ， 也 可 用 卷 积 定理 进行 快速 
卷 积 计算 。 

若 f(xz) 和 AMz) 均 为 非 周期 性 的 序列 ， 则 可 用 延 拓 的 方法 延 拓 为 周期 序列 ， 为 避免 折 县 
现象 ， 可 令 周 期 M > 4+ 杂 -1， 延 拓 后 的 ,Foxz) 和 xz) 表示 为 
Jo 0<sxs 和 和 4-1 


2 0 4-1<xgM-l 人 
Ho 0O<x<B-1 
aol 0 (3-15) 
可 得 到 离散 卷 积 退化 模型 
机 (3-16) 


wmE0 
因为 大 (0x) 和 及 (x) 的 周期 为 M， 所 以 ge(x) 的 周期 也 为 M 。 经 过 这 样 的 延 拓 处 理 ， 一 个 非 周 
期 的 卷 积 问题 就 变 成 了 周期 卷 积 问题 了 ， 因 此 可 以 用 快速 卷 积 法 进行 运算 。 

用 矩阵 形式 表述 离散 的 退化 模型 ， 可 写成 


8= 砌 (3-17) 
式 中 
大 (0) &.(0) 
1 1 
学 忆 0 出 ) 
大 CUM-D 8.(M-D 
互 是 MxM 阶 窍 阵 
久 (0) AD 用-2) … 大 (MT+D 
及 (D 及 (0) 及 (-0  … 玉 (-M+2) 
五 =| 帮 (C2) 及 (D) 和 (0 3 (3-18) 
有 CUM-D AUM-2) 有 CUM-3) … 及 (0) 


利用 太 (x) 的 周期 性 ， 久 (0)= 太 (+M+z)， 式 (3-18) 可 写成 ; 








凡 O) 玉 M-D 玉 (C2) … 玉 (D) 
及 (D) 及 (0) 人 
互 =| 尹 (2) 丸 (D 及 (OOD)  … 玉 (3) (3-19) 


有 CUM-D 玉 UM-2) 到 (M-3) … 下 (0) 
可 以 看 出 ， 妃 为 一 个 循环 矩阵 ， 即 每 行 最 后 一 项 等 于 下 一 行 的 第 一 项 ， 最 后 一 行 的 最 后 一 项 
等 于 第 一 行 的 第 一 项 。 
从 上 述 一 维 模型 可 以 推广 到 二 维 情况 。 如 果 给 出 4x 大 小 的 数字 图 像 ， 以 及 Cx 大 
小 的 点 扩散 函数 ， 可 首先 做 成 大 小 为 M x N 的 周期 延 拓 图 像 。 





oO<x<4-180O<y<B-1 
全 史 cy) 委 工 入 且 0 入 y 乏 0 
0 4-l<xgM- 忒 8B-1<y&N-l 
Ht 人 0O<xsC-IBO<y<D-1 
RE 加 芝 六 
0 cc-l<xgM- 束 D-1<y<N-1 


为 避免 折 和 琵 ， 要 求 M>4+C-1，N>B+D-1。 这 样 一 来 ， 太 Ccy) 和 及 (xy) 分 别 成 
为 二 维 周期 函数 ， 它 们 在 x 和 ?方向 上 的 周期 分 别 为 M 和 。 由 此 得 到 的 二 维 退 化 模型 为 
一 个 二 维 卷 形 式 
AI 


800)= 大 (7 个 友 G 一 my 一 站 + 用 (人 (3-22) 


上 
式 中 ，x=0,12…,M-1; 7y=012…,N-1。ge(Oxoy) 也 为 周期 函数 ， 其 周期 与 上 (xy) 和 
及 (cy) 的 周期 完全 一 样 。 
上 式 也 可 用 和 抢 阵 表示 为 

及 = 再 + 《3-23 

式 中 ，8 、j 丰  、 半 皆 用 行 向 量 堆 释 成 MxN 维 ， 它 把 各 行 顺 时 针 转 90" 堆 重 而 成 ， 都 是 
M x N 维 列 向 量 ， 瑟 为 MN x MN 的 矩阵 

页 rr， 再 -> 怠 

了 豆 有 Eve … 

厅 吉 下， 本 厂 (3-24) 


到- vB 
式 中 ， 每 个 丽 ) 都 是 一 个 Wx N 的 矩阵 ， 是 由 延 拓 函数 六 (x,2) 的 了 行 构成 的 。 


AP0 PN-D 有 CN-2) … 帮 (J 
及 CD 。 帮 O 及 ON-D … 及 (7 

已;=| 邦 (072) 及 (7D) 及 (0 … 太 (73) 《3-25) 
有 ON-D 及 ON-2) 有 OPN-3 … (70) 

可 见 ， 丽 ) 是 一 个 循环 矩阵 ， 而 刀 是 一 个 分 块 循环 矩阵 。 
上 述 离散 的 退化 模型 是 在 线性 空间 不 变 的 前 提 下 推出 的 。 目 的 是 在 给 定 了 g(x,y) ， 并 且 








知道 kx,y) 和 mx,y) 的 情况 下 ， 估 计 出 理想 的 原始 图 像 fx,y) 。 但 是 ， 要 想 从 式 (3-23) 
直接 求解 得 /xy) ， 对 于 实际 大 小 的 图 像 来 说 ， 处 理 的 工作 量 是 十 分 艰巨 的 ， 如 
M=N=5l2 时 ， 娓 窍 阵 的 大 小 为 MVxMN =(512)? x(512) = 262144x262144 ， 求 解 卫 需 
要 解 262144 个 联 立方 程 组 ， 计 算 量 之 大 难以 想象 。 为 解决 这 样 的 问题 ， 须 研究 一 些 简单 算 
法 ， 利 用 再 矩阵 的 循环 性 质 ， 使 简化 运算 得 以 实现 。 
根据 有 关 的 数学 知识 ， 由 于 克 是 分 块 循环 矩阵 ， 则 瑟 可 对 角 化 ， 即 
瓦 = 有 于 (3-26) 
于 为 一 变换 矩阵 ， 大 小 为 MVxMN 维 ， 它 由 MxM 个 大 小 为 Nx N 的 子 块 的 部 分 
组 成 
mw(0,0) w0D  … wmw(OM-D 
0 讽 册 5 人 
wM-10 waM-LD … wUM-LDM-D 
其 中 


wm=em|j 可 mm (3-28) 
式 中 ，im=012…,M -1 ww 为 Nx N 矩阵， 其 元 素 为 


wm-em|j 亚 四] 《3-29) 


到 生 km=012…,N-1。 
， 对 任意 形 如 万 的 分 块 循环 矩阵 ， 丈 都 可 使 其 对 角 化 。 九 是 对 角 阵 ， 其 对 角 元 
网 的 传 里 叶 变 换 有 关 ， 即 如 果 


AIALI 区 
万 ( = 这 大 ee- jx 区: 〈3-30) 


亏 翅 
则 九 的 MN 个 对 角 线 元 素 按 下 面 的 形式 给 出 ， 第 一 组 N 个 元 素 为 妃 (0,0), 瑟 (0.0D, …， 
末 (0,N-D;， 第 二 组 为 万 (00), 末 (0D…, 瑟 (LN-D :， 依 此 类 推 ， 最 后 的 N 个 对 角 线 元 素 为 
万 (M -10), 感 CNM -1D…, 瑟 CM -LN-D 。 由 上 述 元 素 组 成 的 整个 矩阵 再 乘 以 MN 得 到 
刀 ， 即 有 








本 i = 大 
D(KD= 和 N 号 
了 关 大 
0 
式 中 ， 伯 表示 不 超过 的 最 大 闽 数 。 tnmod N 代表 用 N 除 大 所 得 到 的 余 才 。 
从 而 退化 模型 可 写成 
= 开 +m=FD 开 + 人 3 劝 
于 ”8 = 刀 取 ”三 + 且 一 (3-33) 
可 以 证 明 


训 





于-8=FecfGtwy] (3-34) 
丈 - 7=Fec[Fowy] 人 35) 


环 "a=Fec[NGooy] (3-36) 
式 中 ，Fec [] 是 将 矩阵 拉 伸 为 向 量 的 算 子 ， 例 如 


1 
7ee{1 21-|2 
人 3 


Go 、FGom 和 Nov) 分 别 是 gCx 妨 、JCcD) 和 my) 的 二 维 傅 里 叶 变 换 。 于 是 有 
GUeyD)=MNMNHGCYJFGcD+NGOce) (3-37) 


这 样 就 将 求 f(x,y) 的 过 程 转换 为 求解 F(x,v) 的 过 程 ， 简 化 了 计算 过 程 ， 同 时 上 式 也 是 
进行 图 像 复 原 的 基础 。 


3.3 ” 非 约 束 复原 


图 像 复 原 的 主要 目的 是 在 假设 具备 退化 图 像 gs 及 妃 和 5 的 某 些 知识 的 前 担 下 ， 估 计 出 
原始 图 像 大 的 估计 值 记 ， 估 计 值 广 应 使 准则 为 最 优 〈 常 用 最 小 )。 如 果 仅仅 要 求 某 种 优化 准 
则 为 最 小 ， 不 考虑 其 他 任何 条 件 约束 ， 这 种 复原 方法 为 非 约 束 复原 法 。 





国 非 约 束 复原 的 代数 方法 
由 前 面 介 绍 的 图 像 退化 模型 可 知 ， 其 噪声 项 为 
7m=8-E7 (3-38) 


在 并 不 了 解 噪声 项 的 情况 下 ， 希 望 找到 一 个 太 使 得 吾 太 在 最 小 二 乘 方 意义 上 来 说 近 
似 于 g， 也 就 是 说 ， 希 望 找到 一 个 了 的 估计 方 ， 使 得 

| 中 =|s=- 二 | (3-39) 
为 最 小 ， 由 定义 可 知 

人 = 和 

0 二 《3-40) 

|e- 克 | =e- 太 Te-Z) 

求 | 中 最 小 等 效 于 求 |e- 不 | 最 小 , 即 


COPD=|e- 三 | (3-41) 
实际 上 是 求 ./( 记 ) 的 极 小 值 问题 。 求 式 〈3-41) 极 小 值 的 方法 可 以 采用 一 般 的 求 极 值 的 
方法 进行 处 理 。 把 J(7) 对 ( 广 ) 微 分， 并 使 结果 为 零 ， 即 
axC7) 7 》 
一 :一 =-2 瑟 ( 8- 本 )=0 〈3-42) 
过 (8 本 ) 


由 式 (3-42) 可 推导 出 





HTHF=Hrg (3-43) 


即 


广 =(BHTED) ET8 (3-44) 
令 M=N， 因 此 ， 互 为 一 方 阵 ， 并 且 设 妞 ”存在 ， 则 可 求 得 广 ， 即 
广 = 有 CT ET =T8 (3-45) 
以 上 就 是 在 非 约束 条 件 下 ， 利 用 最 小 二 乘 方 准则 和 线性 代数 的 方法 ， 求 取 原 图 像 信 号 的 
最 近似 值 广 的 推导 过 程 。 





逆 滤 波 复原 法 也 叫做 反 向 滤波 法 ， 其 主要 过 程 是 首先 将 要 处 理 的 数字 图 像 从 空间 域 转换 
到 傅 里 叶 频 率 域 中 ， 进 行 反 向 滤波 后 再 由 频率 域 转换 到 空间 域 ， 从 而 得 到 复原 的 图 像 信 号 ， 
基本 原理 如 下 。 

如 果 退 化 图 像 为 gC) ， 原 始 图 像 为 ,Fr(x,y) ， 在 不 考虑 噪声 的 情况 下 ， 其 退化 模型 用 
式 (3-11) 表示 ， 现 在 将 其 重 写 如 下 

goD= 站 站 wp)n-wy-Pdadp 
上 式 两 边 进行 傅 里 叶 变换 得 
Gy) = Fey)Gev) (3-46) 

式 中 ，GCuwy) ， 瑟 (tw ，FGoy) 分 别 是 退化 图 像 g(x) ， 点 扩散 函数 kx,y) ， 原 始 图 像 
Joy) 的 傅 里 叶 变换 。 

由 式 (3-46) 以 及 傅 里 叶 逆 变 换 公式 可 得 


Fw)= 汉人 (3-47) 
2 
Jo)=FTFGom=F [| (3-48) 
2 


式 中 ， 瑟 (wyv) 可 以 理解 为 成 像 系 统 的 “滤波 ”传递 函数 。 在 频 域 中 系统 的 传递 函数 与 原 图 
像 信 号 相 乘 实 现 “ 正 向 滤波 ” 这 里 C(xwy) 除 以 瓦 (w 妇 起 到 了 “ 反 向 滤波 ”的 作用 。 这 意味 
着 ， 如 果 已 知 退化 图 像 的 傅 里 叶 变 换 和 “滤波 ”传递 函数 ， 则 可 以 求 得 原始 图 像 的 傅 里 叶 变 
换 ， 经 反 传 里 叶 变 换 就 可 求 得 原始 图 像 Fr(x,) 。 这 就 是 逆 滤 波 复原 法 的 基本 原理 。 

前 面 为 了 分 析 问题 的 简化 ， 没 有 考虑 噪声 的 影响 。 在 有 噪声 的 情况 下 ， 逆 滤波 复原 法 的 
基本 原理 可 写成 如 下 形式 


GoW= FomEGomD+Neo (3-49) 
EC (3-50) 
Ce 


式 中 ，NGuv) 是 噪声 mx, 的 傅 里 叶 变换 。 

由 于 在 逆 滤 波 复原 公式 〈3-48) 中 ， 万 (wyv) 处 于 分 母 的 位 置 上 ， 利 用 式 (3-49) 和 式 
(3-50) 进行 图 像 复原 处 理 时 可 能 会 发 生 下 列 情况 : 即 在 wy 平面 上 有 些 点 或 区 域 会 产生 
末 Gy) =0 或 妃 (u) 非 常 小 的 情况 ， 在 这 种 情况 ， 即 使 没有 噪声 ， 也 无 法 精确 地 恢复 


训 








JeD)。 另 外 ， 在 有 噪声 存在 时 ， 在 已 (ww) 的 领域 内 ， 瑟 (us 岂 的 值 可 能 比 Neww) 的 值 
小 得 多 ， 因 此 由 式 〈3-50) 得 到 的 噪声 项 可 能 会 非常 大 ， 这 样 也 会 使 fCxy) 不 能 正确 
恢复 。 

一 般 来 说 ， 逆 滤波 复原 法 不 能 正确 地 估计 巨 (wy) 的 零点 ， 因 此 必须 采用 一 个 折 中 的 方 
法 进行 解决 。 实 际 上 ， 逆 滤波 不 是 用 1 Fwv) ， 而 是 采用 另外 一 个 关于 zwv 的 函数 


Muw) 。 它 的 处 理 框图 如 图 3-5 所 示 。 
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图 3-5 实际 的 逆 滤 波 处 理 框图 
在 没有 零点 并 且 也 不 存在 噪声 的 情况 下 ， 有 
Mov)= 





《3-51) 
石 (0o) 


图 3-5 的 模型 包括 了 退化 和 恢复 运算 。 退 化 和 恢复 总 的 传递 函数 可 用 万 (uv) My) 来 
表示 。 此 时 有 
户 o)=LEGowMGcwlFGoy) (3-52) 


式 中 ，Roy) 是 FGoy) 的 估计 值 ，EGov) 是 六 ao) 的 傅 里 叶 变 换 ， 瑟 (ww) 是 输入 传递 函 


数 ; M(wv) 是 处 理 传递 函数 ;五 (x,v) M(xw,v) 是 输出 传递 函数 。 

一 般 情况 下 ， 可 以 将 图 像 的 退化 过 程 视 为 一 个 具有 一 定 带宽 的 带 通 滤波 器 ， 随 着 频 
率 的 升 高 ， 该 滤波 器 的 带 通 特性 很 快 下 降 ， 即 太 (wv) 的 幅度 随 着 w，v 平面 原点 的 距离 
的 增加 而 迅速 下 降 ， 而 噪声 项 NGwyv) 的 幅度 变化 是 比较 平缓 的 。 在 远离 w，v 平面 的 原 
点 时 NGww) /ECcuv) 的 值 就 会 变 得 很 大 ， 而 对 于 大 多 数 图 像 来 说 ， Fu) 却 变 小 ， 在 这 
种 情况 下 ， 噪 声 反而 占 优势 ， 自 然 无 法 满意 地 恢复 出 原始 图 像 。 这 一 规律 说 明 ， 应 用 逆 
滤波 时 仅 在 原点 领域 内 采用 LA(uW) 方 能 有 效 。 换 句 话说 ， 应 使 M(xwv) 在 下 述 范围 内 
选择 





1 
MoW=j CeyJ 
1 
式 中 ，w 的 选择 应 该 将 五 (uwv) 的 零点 排除 在 此 领域 之 外 。 
验证 明 ， 当 变质 图 像 的 信 噪 比较 高 ， 如 信 噪 比 SVR=1000 或 更 高 ， 而 且 轻 度 变 质 时 ， 
逆 滤 波 复原 方法 可 以 获得 较 好 的 效果 。 


3.4 ”有 约束 复原 


为 了 在 数学 上 更 容易 处 理 ， 通 常 在 无 约束 复原 方法 的 基础 上 附加 一 定 的 约束 条 件 ， 从 而 
在 多 个 可 能 结果 中 选择 一 个 最 佳 结 果 ， 这 便 是 有 约束 复原 方法 。 


+ 只 区 骨 
到 -537 
+ 只 > 





50-| 








有 最 小 二 乘 类 约束 复原 


无 约束 复原 是 除了 使 准则 函数 /( 记 =|g- 不 | 最 小 外 ， 再 没有 其 他 约束 条 件 。 因 此 只 需 
要 了 解 退 化 系统 的 传递 函数 或 点 扩展 函数 玉 ， 就 能 利用 式 3-44) 或 式 3-45) 进行 复原 。 
但 是 由 于 传递 函数 娓 奇异 性 的 问题 ， 复 原 只 能 局 限 在 靠近 原点 的 有 限 区 域内 进行 ， 这 就 使 得 
无 约束 复原 方法 具有 较 大 的 局 限 性 。 

最 小 二 乘 类 约束 复原 是 指 除了 要 求 了 解 关 于 退化 系统 的 传递 函数 万 之 外 ， 还 需要 知道 
某 些 噪声 的 统计 特性 或 噪声 与 图 像 的 某 些 相关 情况 。 根 据 所 了 解 的 噪声 先 验 知识 的 不 同 ， 应 
采用 不 同 的 约束 条 件 ， 可 得 到 不 同 的 图 像 复原 技术 。 

在 最 小 二 乘 类 约束 复原 中 ， 复 原 问题 表现 为 在 满足 | 中 =|g- 不 | 的 约束 条 件 下 ， 要 设法 
寻找 一 个 最 优 估计 广 ， 使 得 形式 为 |o?| = 的 函数 最 小 化 。 对 于 这 类 问题 的 有 约束 最 小 化 
问题 ， 通 常 采用 拉 格 朗 日 乘 数 法 进行 处 理 。 即 寻找 一 个 广 ， 使 得 如 下 准则 函数 最 小 。 


CD=|of :le- 二 -op) (3-54) 
式 中 ，@ 为 广 的 线性 算 子 ， 1 为 一 常数 〈 称 为 拉 格 朗 日 乘 子 )。 对 式 3-54) 求 导 ， 可 得 
到 /=20O7-2276- 且 )-0 (3-55) 
7-(martorol Frg (3-56) 
令 y=1/4， 得 
广 =(HTH+7OIOD ET8 (3-57) 


常数 4 必须 反复 迭代 齐整 ， 直到 满足 约束 条 件 | 中 =|s=- 过 | 求解 式 (3-57) 的 关键 
就 是 如 何 选用 一 个 合适 的 变换 矩阵 C 。 

相对 于 无 约束 问题 ， 有 约束 条 件 的 图 像 复 原 更 符合 图 像 退 化 的 实际 情况 ， 因 此 其 适应 面 
更 加 广泛 。 对 式 〈3-57)， 若 选择 不 同形 式 的 @ 矩阵 ， 则 可 得 到 不 同类 型 的 有 约束 最 小 二 乘 
方 类 图 像 复 原 方法 。 如 果 采 用 图 像 / 和 噪声 的 自 相 关 和 矩阵 Rr 和 尽 , 表示 @ ， 就 可 以 得 到 维 纳 
滤波 复原 方法 。 若 采用 拉 普 拉 斯 算 子 形式 ， 即 使 某 个 函数 的 二 阶 导数 最 小 ， 那 么 也 可 推导 出 
有 约束 最 小 平方 复原 方法 。 

下 面 是 最 小 二 乘 滤波 复原 的 MATLAB 应 用 ， 如 图 3-6 所 示 。 

程序 代码 如 下 : 


=imread(F:image\lenabmp'); % 读 取 原 始 图 像 
LEN=31; 

% 图 像 的 模糊 化 

THETA=11; 

PSF1= 合 pecial(motion,LEN,THETA); 
PSF2= 借 pecial(gaussian',10,5); 


记 


1<51. 














Blurred1=imfilter(L.PSFl,circular,conv); 
Blurred2=imfilter(L.PSF2,conv'); 

% 模 糊 化 图 像 加 噪 

V=.002; 
BlurredNoisy1=imnoise(Blurred1,gaussian',0,.V); 
BlurredNoisy2=imnoise(Blurred2,gaussian',0,V); 
figure, 

subplot(1.3,1);imshow(D) 

title( lena ) 

% 用 真实 的 PSF 函数 和 噪声 强度 作为 参数 进行 图 像 复 原 
NP=V*prod(size(D); 
regl=deconvreg(BlurredNoisyl,PSFLNP); 
reg2=deconvreg(BlurredNoisy2,PSF2,NP); 
figure; 

subplot(1.3.2);imshow(reg1); 

title(Restoredl with NP) 

figure; 


subplot(1,.3,3) :imshow 人 reg2); 
title(Restored2 with NP)) 





图 3-6 用 真实 的 PSFO 函 数 和 噪声 强度 作为 参数 的 约束 最 小 二 乘 滤波 复原 
熙 原始 图 像 bjBlurredNoisyl 一 "motion” c)BlurredNoisy2 一 “gaussian” 


- 般 情 况 下 ， 图 像 信 号 可 近似 为 平稳 随机 过 程 ， 维 纳 滤波 的 基本 原理 是 将 原始 图 像 了 
始 图 像 的 估计 广 看 为 随机 变量 ， 按 照 使 和 估计 值 广 之 间 的 均 方 误差 达到 最 小 的 准则 





实现 图 像 复 原 ， 即 


e= ELACcD 人 -cy (3-58) 


式 中 ， 刀 ] 表 示 数 学 期 望 。 





设 Rr 和 玉 , 分 别 是 洲 和 闫 的 自 相 关 和 矩阵 ， 定 义 如 下 : 
Rr=EC1) 《3-59) 
及 ,= EEC) (3-60) 





根据 上 述 定义 可 知 ，Rr 和 责 , 均 为 实 对 称 矩 阵 。 在 大 多 数 实际 图 像 中 ， 相 近 像 素 点 是 高 
度 相 关 的 ， 而 距离 较 远 的 像素 点 的 相关 性 则 相对 较 弱 。 通 常情 况 下 ， 无 论 是 三 还 是 赂 其 元 
素 之 间 的 相关 不 会 延伸 到 20 一 30 个 像素 的 距离 之 外 。 因 此 ， 一 般 来 说 ， 自 相关 和 矩阵 Rr 和 
及 ,在 主 对 角 线 附近 有 一 个 非 零 元 素 区 域 ， 而 矩阵 的 右上 角 和 左上 角 的 区 域内 将 接近 零 值 。 
如 果 像 素 之 间 的 相关 是 像素 距离 的 函数 ， 而 不 是 像素 位 置 的 函数 ， 则 可 将 Rr 和 民 , 近似 为 分 








块 循环 矩阵 。 因 而 ， 用 循环 矩阵 的 对 角 化 ， 可 写成 如 下 形式 ， 
Rr =P4 卫 (3-61) 
玉 ， = FFB 了 于 (3-62) 
球 为 WMNxMN 托 阵 ， 包 含 MxM 个 NxN 子 矩阵 。 
以 灰 亿 mm) 表示 球 的 ;和 闫 列 分 块 矩阵 ， 则 








ax 
刺 (o0)=ew v =012 ,AM-1 (3-63) 
有 rw 是 NMxN 矩阵 ， 以 丈 ( 纺 四 表示 大 行 2 列 元 素 ， 则 有 


人 (3-64) 
和 矩阵 4、 召 的 元 素 分 别 为 矩阵 R 和 郧 , 中 的 自 相 关 元 素 的 传 里 叶 变 换 ， 这 些 自 相 关 的 傅 
里 叶 变 换 分 别 定义 为 大 (xD 妨 和 严 (z 轨 的 谱 密度 RrGo 六 和 已 oo 。 
定义 OO = R7 R, 代入 式 (3-57)， 则 
广 =(HT 瑟 +7RPR JETS 
一 ( 厂 刀 * 万 到 ”十 7 于 4 及 不 FFD* 刺 -8 


因此 可 得 
卫 一 广 = (D* 刀 +741B)D* 卫 -8 (3-65) 
若 M=N， 则 有 
区 
com)= | 邮 训 亲 GG 
Goyj 人 
， 
二 (3-66) 
厅 (o) ao 四 +y 忆 Go) 
己 @o) 


若 =1， 则 称 为 维 纳 滤波 器 ， 当 无 噪声 影响 时 ， 由 于 忆 (w=0， 则 退化 为 道 滤波 器 ， 
又 称 为 理想 的 逆 滤 波 器 ， 因 此 ， 逆 滤波 器 是 维 纳 滤波 器 的 一 种 特殊 情况 。 需 要 注意 的 是 ， 
y =1 并 不 是 在 有 约束 条 件 下 的 最 佳 解 ， 此 时 并 不 满足 约束 条 件 | 中 =|e- 丰 | 。 若 7 为 变 参 
数 ， 则 称 为 变 参 数 维 纳 滤波 器 。Slepian 将 维 纳 去 卷 积 推广 用 于 处 理 卷 积 计算 效 率 的 方法 。 

维 纳 去 卷 积 提供 了 一 种 在 有 曲 声 情况 下 导出 去 卷 积 传递 函数 的 最 优 方法 ， 但 下 面 的 三 个 
问题 限制 了 它 的 有 效 性 。 

1) 当 图 像 复原 的 目的 是 供 人 观察 时 ， 方 均 误差 (MSE) 准则 并 不 是 一 个 特别 好 的 优化 
准则 。 这 是 因为 MSE 准则 不 管 其 在 图 像 中 的 位 置 ， 对 所 有 误差 都 赋予 同样 的 权 ， 而 人 眼 则 


训 

















对 暗 处 和 高 梯度 区 域 比 其 他 区 域 的 误差 具有 较 大 的 容忍 性 。 由 于 使 方 均 误差 最 小 化 ， 
因此 维 纳 滤波 器 以 一 种 并 非 最 适合 人 眼 的 方式 对 图 像 进行 了 平滑 。 

2) 经 典 的 维 纳 积 不 能 处 理 具有 空间 可 变 点 扩散 函数 的 情形 ， 如 存在 在 差 、 散 差 、 
表面 像 场 弯曲 以 及 包含 旋转 的 运动 模糊 等 情况 。 

3) 这 种 技术 不 能 处 理 非 平 稳 信号 和 噪声 的 一 般 情形 。 许 多 图 像 都 是 高 度 非 平 衡 的 ， 
有 着 被 陡峭 边缘 分 开 的 大 块 平 坦 区 域 。 此 外 ， 一 些 重要 的 噪声 源 具 有 与 局 部 灰 度 有 关 的 
特性 。 

下 面 是 维 纳 滤 波 复原 的 MATLAB 应 用 ， 如 图 3-7 所 示 。 














b 





图 3-7 采用 真实 PSFO 函 数 的 维 纳 滤波 复原 〈 无 噪声 ) 


引 原始 图 像 bj)Blurred 一 “motion” c)Blurred 一 “gaussian” 


得 序 代码 如 下 : 


imread(lena.bmp); 
LEN=31; 





PSF2= 借 pecial( gaussian,10,5); 





Blurredl=imfilter(L.PS 
Blurred2=imfilter(LPSF2.convy; 

V=.002; 
BiurredNoisy1=imnoise(Blurredl,gaussian,0,V); 
BlurredNoisy2=imnoise(Blurred2,gaussian,0,V); 
figure， 

subplot(1.3.1):imshow(D); 

titleClenan; 


1,circularvconv'); 


wnrl=deconvwnr(Blurredl,PSF1); 
wnr2=deconvwnr(Blurredl,PSF2); 
figure; 
subplot(1.3,2):imshow(wnrl; 
titleCRestoredl,True PSF7; 

fieure; 

subplot(1.3.3) :imshow(wnr2); 








title('Restored2,True PSF) 


从 复原 的 图 像 来 看 ， 对 于 运动 引起 的 模糊 图 像 的 复原 效果 要 好 于 因 gaussian 模糊 的 图 像 
复原 的 效果 。 但 这 是 假定 预先 知道 引起 模糊 的 精确 点 扩散 函数 ， 实 际 图 像 处 理 时 ， 大 多 数 情 


况 下 





法 准确 得 知 精确 点 扩散 函数 ， 一 般 采 用 估计 的 PSFO 函 数 来 复原 图 像 。 下 面 的 例子 是 志 
针对 运动 引起 的 图 像 模糊 ， 利 用 估计 的 点 扩散 函数 ， 相 对 于 真实 





扩散 函数 ， 分 别 采 用 了 


过 大 的 模糊 距离 参数 和 过 大 的 模糊 运动 方向 角度 参数 ， 如 图 3-8 所 示 。 


中 





图 3-8 利用 估计 的 PSFO 函 数 复原 模糊 图 像 〈 
a) 过 大 的 模糊 距离 参数 b) 过 大 的 模糊 运动 方向 角度 参数 


BlurredNoisy1=imnoise(Blurredlvgaussianv0,V); 
BlurredNoisy2=imnoise(Blurred2,gaussian0,V); 
wnr3=deconvwnr(Blurredl,PSFT); 
wnr3=deconvwnr(Blurredl,fspecial(motion"2*LENTHETAD); 
wnr4=deconvwnr(Blurredl,fspecialtmotion,LEN,2*THETA)); 
figure; 

subplot(1.2,1:imshow(wnr3); 

title(RestoredLTrue PSF; 

figure; 

subplot(1,2.2):imshow(wnr2); 

title(Restored2,True PSF7 


除了 利用 以 上 参数 进行 图 像 复 原 ，MATLAB 还 提供 了 利用 图 像 的 自 相 关 信息 来 提高 图 像 复 


原 质量 的 方法 ， 这 需要 提供 信 





自 相关 函数 ICORRO 和 噪声 的 自 相关 函数 NCORRO。 


程序 代码 如 下 : 


NP=(V*prodGsize(D)).^2; 

NPOW=sum(NP(C))/prod(size(D)); % 噪 声 功率 
NCORR=ffshift(real(ifftn(NP))7); % 噪 声 自 相关 函数 CACF) 
IP=abs(ffn(im2double(D)).^2; 
IPOW=sum(IP())prodfsize(D);% 原 始 图 像 的 功率 
ICORR=ffishift(realtiffn(IP); % 图 像 自 相关 函数 〈ACF 
wnr5=deconvwnr(BlurredNoisyl,PSFLNCORR.ICORR); 











wnr6=deconvwnr(BlurredNoisy2,PSF2,NCORR,ICORR); 
figure; 

subplot(1.2,1):imshow(wnrs); 
subplot(1,2,2);imshow(wnr6) 


图 像 复 原 结果 如 图 3-9 所 示 。 








图 3-9 利用 自 相关 信息 进行 图 像 复 原 


二 BluredNoisy 一 "motion” bj)BlurredNoisy 一 “gaussian” 








Lucy_Richardson 算法 是 最 广泛 的 图 像 复 原 技术 之 一 ， 采 用 友 代 的 方法 。 
Lucy_Richardson 算法 能 够 按照 泊 松 噪声 统计 标准 求 出 与 给 定 PSF 卷 积 后 ， 最 有 可 能 成 为 输 
入 模糊 图 像 的 图 像 。 当 PSF 已 知 ， 但 图 像 噪声 信息 未 知 时 ， 也 可 以 使 用 这 个 函数 进行 有 效 的 

工作 。 从 成 像 方程 和 Poissian 统计 可 以 有 如 下 推导 : 
IDO= 六 PE\V7)OO) 《3-67) 


式 中 ，O 是 原始 图 像 ，PU\7) 是 PSFO 函 数 ，7 是 无 噪声 模糊 图 像 。 在 已 知 GD) 时 ， 在 每 个 














像素 计 DO) 的 联合 似 然 函数 为 
mnIT=DoOmzO-7O-mDOl (3-68) 
当 式 〈3-68) 存在 时 ， 最 大 联合 似 然 函 数 的 解 存 在 。 
| 二 天 | 击 丽 二 (3-69) 
5 下 知 下 evw 0 
则 可 得 Lucy_Richardson 迁 代 式 ， 即 
oO=oOZPGDO /Pa (3-70) 


可 以 看 出 每 次 欠 代 时 ， 都 可 以 提高 解 的 似 然 性 ， 随 着 迭代 次 数 的 增加 ， 最 终 将 会 收 伍 在 
具有 最 大 似 然 性 的 解 处 。 

MATLAB 提供 的 deconvlucy0) 函 数 ， 就 是 利用 加 速 收敛 的 Lucy_Richardson 算法 对 图 像 
进行 复原 。deconvlucy0 函 数 还 能 够 用 于 实现 复杂 图 像 重 建 的 多 种 算法 中 ， 这 些 重建 算法 都 是 








基于 原始 Lucy_Richardson 最 大 化 可 能 性 算法 。deconvlucy0) 函 数 的 调用 方式 如 下 : 

@ J=deconvlucy(LPSF) 

@ J=deconvlucy(ILPSFNUMIT) 

@ ]=deconvlucy(LPSFNUMITDAMPAR) 

@ J=deconvlucy(LPSFENUMITDAMPAR,WEIGHT) 

@ J=deconvlucy(LPSFNUMITDDAMPAR,WEIGHTREADOUT) 

@ ]=-deconvlucy(LPSF, NUMITDAMPAR,WEIGHTREADOUTSUBSMPL) 

其 中 ，I 表示 输入 图 像 。PSF 表示 点 扩散 函数 。 其 他 参数 都 是 可 选 参数 : NUMIT 表示 算 
法 的 重复 次 数 ， 默 认 值 为 10，DAMPAR 表示 偏差 闪 值 ， 默 认 值 为 0 (无 偏差 )，WEIGHT 表 
示 像 素 加 权 值 ， 默 认 值 为 原始 图 像 的 数值 ，READOUT 表示 噪声 矩阵 ， 默 认 值 为 0; 
SUBSMPL 表示 子 采 样 时 间 ， 默 认 值 为 1。 

deconvlucy0) 函 数 的 输出 J 是 一 个 单元 数组 ， 包 含 4 个 元 素 : output(1)， 原 始 输入 图 像 ; 
output(2)， 最 后 一 次 反复 产生 的 图 像 ，output(3)， 倒 数 第 二 次 产生 的 图 像 ，output(4)， 
deconvlucy 函数 用 来 获知 重新 起 始点 的 内 部 信息 。 输 出 的 单元 数组 可 以 作为 输入 参数 传递 给 
deconvlucy 函数 ， 从 而 重新 开始 反复 计算 过 程 。 

噪声 痕迹 是 最 大 化 可 能 性 数据 逼近 算法 的 常见 问题 。 经 过 多 次 重复 处 理 ， 尤 其 是 在 低 信 
噪 比 条 件 下 ， 重 建 图 像 可 能 会 出 现 一 些 斑点 ， 这 些 斑点 并 不 代表 图 像 的 真实 结构 ， 是 输出 图 
像 过 于 通 近 噪声 所 产生 的 结果 。 要 有 效 控制 这 些 痕迹 ， 可 以 使 用 deconvlucy 函数 的 收敛 参数 
DAMPAR， 该 参数 指定 了 收敛 过 程 中 结果 图 像 与 原始 图 像 背离 程度 的 阔 值 。 对 于 那些 超过 效 
值 的 数据 ， 将 不 再 允许 进行 反复 计算 。 

图 像 复 原 的 另 一 复杂 之 处 是 那些 可 能 包括 坏 像 素 的 数据 ， 可 能 会 随时 间 和 位 置 的 变化 而 

变化 。 这 样 ， 可 以 通过 deconvlucy() 函 数 的 WEIGHT 数组 参数 ， 指 定 图 像 中 可 以 忽略 的 某 些 
像素 ， 将 需要 忽略 的 像素 对 应 WEIGHT 数组 元 素 ， 设 置 为 0。 
器 中 的 噪声 由 两 部 分 组 成 ， 一 是 呈 泊 松 分 布 的 光子 计算 噪声 ， 一 是 镜头 呈 高 斯 分 布 
的 读 取 噪 声 。 在 利用 Lucy_Richardson 算法 进行 图 像 复 原 的 过 程 中 可 以 声明 第 一 种 类 型 的 噪 
声 ， 但 是 第 二 种 噪声 情况 用 户 必 须 自 己 声明 ，deconvlucy(0) 函 数 使 用 READOUT 参数 指定 噪 
声 类 型 ， 其 值 通常 是 读 取 噪 声 变量 和 背景 噪声 变量 的 总 和 ， 其 数值 的 大 小 将 指定 能 够 确保 所 
有 数值 为 正 数 的 偏 移 量 。 

如 果 对 采样 不 足 的 数据 进行 重建 ， 而 重建 过 程 建立 在 一 个 较 好 的 网 格 操作 基础 上 ， 则 重 
建 效 果 就 可 以 大 大 提高 。 如 已 知 PSF 具有 较 高 的 分 辨 率 ， 则 deconviucy0 函 数 使 用 SUBSMPL 
参数 指定 采样 不 足 的 比例 。 

另外 ，PSF 还 可 以 通过 观察 像素 偏 移 或 光学 模型 技术 获得 。 这 种 方法 对 高 信 品 比 图 像 万 
为 有 效 ， 因 为 目标 图 像 可 以 被 有 效 地 限制 在 像素 的 中 心 位 置 。 如 果 图 标 图 像 位 于 两 个 像素 之 
间 ， 那 么 它 将 被 作为 领域 像素 的 组 合 进行 重建 。 一 个 好 的 网 络 将 会 使 目标 图 像 扩散 流 序列 重 
新 朝向 图 像 的 中 心 。 

下 面 给 出 实例 说 明 deconvlucy0O 函 数 的 具体 使 用 方法 。 

以 下 程序 段 首 先 读 取 原 始 电路 板 图 像 ， 如 图 3-10a 所 示 ， 然 后 对 原始 图 像 进 行 加 载 模糊 
化 ， 仿 真传 输 失 真 现象 ， 如 图 3-10b 所 示 。 对 模糊 图 像 调用 deconvlucy0 函 数 进行 图 像 复 
原 ， 得 到 如 图 3-10c 所 示 的 结果 。 
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imread(board.tify; 

II(50+[1:256].2+[1:256].2); 
figure:imshow(DtitleC Original Image); 

PSF= 仿 pecial(gaussian,5.5); 
Blurred=imfilter(L,PSF,symmetricvconv); 

V=.002; 
BlurredNoisy=imnoise(Blurred,gaussian0,V); 
figure;imshow(BlurredNoisy):title(Blurred & Noisy); 
lucl=deconvlucy(BlurredNoisy,PSF,5); 
figure;imshow(lucl):titleCRestored ImageNUMIT=S?; 





图 3-10 ”原始 图 像 加 噪 及 恢复 
原始 图 像 b) 模糊 加 噪 e) 恢复 图 像 


deconvlucy() 函 数 的 其 他 参数 调用 方法 及 其 效果 与 前 面 两 个 图 像 复 原 函 数 类 似 ， 不 再 
袭 述 。 

E 言 解 卷 积 复原 | 

前 面 几 种 图 像 复 原 方法 都 是 在 知道 模糊 图 像 的 点 扩展 函数 的 情况 下 进行 的 ， 而 在 实际 应 
用 中 ， 通 常 都 要 在 不 知道 点 扩展 函数 的 情况 下 进行 图 像 复 原 。 盲 解 卷 积 复原 就 是 在 这 种 应 用 
背景 下 提出 的 。 盲 解 卷 积 复原 是 利用 原始 模糊 图 像 ， 同 时 估计 PSF 和 清晰 图 像 的 一 种 图 像 复 
原 方法 。 具 体 实 现 算法 有 先 验 模 糊 辨 识 方法 、 非 参数 限定 支持 域 恢复 方法 ， 以 及 ARMA 参 
数 估计 方法 、 基 于 高 阶 统计 量 的 非 参数 法 等 。 

MATILAB 7.0 提供 了 deconvblind0 函 数 用 于 实现 言 解 卷 积 ， 该 函数 类 似 于 加 速 收 敛 Lucy- 
Richardson 算法 的 执行 过 程 ， 同 时 要 重建 图 像 和 PSF。 盲 解 卷 积 算法 一 个 很 好 的 优点 就 是 ， 在 
对 失真 情况 〈 包 括 噪声 和 模糊 ) 毫 无 先 验 知识 的 情况 下 ， 仍 然 能 够 实现 对 模糊 图 像 的 复原 操 
作 。 同 时 ，deconvblindO 函 数 与 deconvlucy0 函 数 一 样 ， 也 可 以 用 于 实现 多 种 复杂 图 像 重 建 修 
改 壬 法 ， 而 这 些 算 法 都 是 以 原始 Lucy-Richardson 最 大 化 可 能 性 算法 为 基础 的 。 

deconvblind 函数 的 调用 格式 如 下 ; 

@ [JTJ, PSF]- deconvblind(L, INITPSF) 

@ [JJ, PSF]- deconvblind(L, INITPSF, NUMIT) 











@ [J,PSF]= deconvblind(L INITPSF,NUMITDAMPAR) 

@ [JJ,PSF]= deconvblind(L, INITPSF, NUMIT DAMPAR, WEIGHT) 

@ [J, PSF]= deconvblind(, INITPSF, NUMIT DAMPAR, WEIGHT READOUT) 

其 中 ，I 表示 输入 图 像 ，INITPSF 表示 PSF 的 估计 值 ，NUMIT 表示 算法 重复 次 数 ， 人 地) 
DAMPAR 只 表示 偏 移 阔 值 ，WEIGHT 用 来 屏蔽 坏 像素 ，READOUT 表示 噪声 和 矩阵。 输出 参 
数 J 表 示 复 原 后 的 图 像 ，PSF 与 INITPSF 具有 相同 的 大 小 ， 表 示 重 建 点 扩散 函数 

下 面 将 通过 几 个 程序 代码 实例 来 说 明 deconvblindO) 函 数 的 使 用 方法 。 

1. 图 像 模糊 化 

首先 利用 以 下 程序 段 ， 读 取 原 始 图 像 ， 如 图 3-11 所 示 ， 然 后 生成 如 图 3-12 所 示 的 点 扩 
展 函 数 PSF， 再 对 图 像 进行 模糊 化 ， 模 糊 结果 如 图 3-13 所 示 。 


图 3-11 原始 图 像 图 3-12 真实 PSF 图 3-13 ”模糊 后 的 图 像 





















Timread(cameraman.tify; 


figure:imshow(D:titleCOriginal Imagey; 
PSF= 人 pecial(motion',13,45); 
figure:imshow(PSF,D)xtitleCTrue PSF; 
Blurred=imfilter(LPSF,circevconv; 
figure;imshow(Blurred):titleCBlurred Image7; 





2. 图 像 复 原 
在 调用 deconvblind(O) 函 数 进行 4 INITPSF 的 大 小 是 要 的 一 个 指标 。 在 
实际 应 用 中 ， 通 过 分 析 ， 都 是 使 用 不 同 大 小 的 PSF 对 图 像 进行 重 建 ， 从 中 选择 一 个 最 合适 的 


PSF 值 。 以 下 程序 段 以 真实 大 小 的 INITPSF 进行 图 像 复原 ， 得 到 初步 复原 结果 ， 如 图 3-14a 
所 示 ， 同 时 初步 重建 PSF， 如 图 3-14b 所 示 。 

INITPSF=ones(size(PSF)); 

[TD P]=deconvblind(BlurredJINITPSF,30); 

figure;imshow(); 

figure;imshow(P,[],notruesize7; 


F 面 是 利用 WEIGHT 数组 对 权 值 矩阵 图 像 进行 重建 ， 得 到 如 图 3-15 所 示 的 复原 结果 。 
由 图 可 以 看 出 ， 复 原 后 的 图 像 消 除了 “ 环 ”的 存在 ， 但 是 复原 结果 仍然 有 一 定 的 失真 。 


59 

















程序 代码 如 下 ， 


WEIGHT=edge(IL'sobel',.28); %sobel 算 子 边缘 提取 
sel=strel(disk',1); 





图 3-14 初步 复原 的 图 像 与 初步 重建 使 用 的 PSF 





a 初步 复原 的 图 像 b) 初步 重建 使 用 的 PSF 


se2=strel(line',13,45); 

WEIGHT=1-double(imdilate(WEIGHT,[sel se2]D) % 膨 胀 操作 ， 边 界 像素 设 为 零 
figure;imshow(WEIGHT); 

PI=-P; % 保 存 数 据 

Pl(find(P1<0.01D))-0; % 修 改 PSFO 函 数 

[2 P2]=deconvblind(Blurred,P1,50,[,WEIGHT) % 利 用 上 面 得 到 的 WEIGHT 进行 言 解 卷 积 
figure:imshow(J2); 





figure;imshow(P2,[],notruesize); 
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图 3-15 图 像 复 原 及 使 用 的 PSF 


a 权 值 矩 阵 b) 图 像 复 原 。) 图 像 复 原 








3.5 ” 几 种 其 他 图 像 复原 技术 


前 边 已 经 讨论 了 几 种 基本 的 代数 图 像 复原 技术 。 除 此 之 外 ， 尚 存在 一 些 其 他 的 空间 图 像 他 ) 
复原 方法 ， 本 节 将 对 这 些 方法 进行 一 些 简单 的 讨论 。 





几何 畸变 校正 


在 图 像 的 获取 或 显示 过 程 中 往往 会 产生 几何 畸变 。 例 如 ， 成 像 系 统 有 一 定 的 几何 非 线 
性 。 这 主要 是 由 于 摄像 管 、 摄 像 机 及 阴极 射线 管 显示 器 的 扫描 偏转 系统 有 一 定 的 非 线 性 ， 因 
此 会 形成 如 图 3-16b、e 所 示 的 畸变 图 像 。 图 3-16a 为 原始 图 像 ， 图 3-16b 和 3-16c 分 别 为 
枕 形 畸 变 和 桶 形 畸 变 。 




















a b) 避 
图 3-16 几何 畸变 
a 原始 图 像 b) 枕 形 畸变 e) 桶 形 畸 变 


除 此 之 外 ， 还 有 由 于 斜视 角度 获得 的 图 像 的 透视 畸变 。 另 外 ， 由 卫星 摄取 的 地 球 表面 的 
图 像 往往 覆盖 较 大 的 面积 ， 由 于 地 球 表面 呈 球 形 ， 这 样 摄取 的 平面 图 像 也 将 会 有 较 大 的 几何 
畸变 。 对 于 这 些 图 像 必 须 加 以 校正 ， 以 免 影响 分 析 精 度 。 

由 成 像 系 统 引 起 的 几何 畸变 的 校正 有 两 种 方法 。 一 种 是 预 畸 变法 ， 这 种 方法 是 采用 
与 畸变 相反 的 非 线性 扫描 偏转 法 ， 用 来 抵消 预计 的 图 像 畸变 ;， 另 一 种 是 所 谓 的 后 验 校正 
方法 ， 这 种 方法 是 用 多 项 式 曲线 在 水 平和 垂直 方向 去 拟 合 每 一 条 畸变 的 网 线 ， 然 后 求 得 
反 变 化 的 校正 函数 。 用 这 个 校正 函数 即 可 校正 几何 畸变 的 图 像 。 图 像 的 空间 几何 因 变 及 
其 校正 过 程 如 图 3-17 所 示 。 
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图 3-17 空间 几何 畸变 及 其 校正 的 过 程 


任意 几何 畸变 都 可 以 由 非 畸变 坐标 系 (x,)y) 变换 到 畸变 坐标 系 (x,)) 的 方程 来 定义 。 方 
程 的 一 般 形 式 为 


四 本 





4 (3-71) 


了 = 邦人 切 
在 透视 畸变 的 情况 下 ， 变 换 是 线性 的 ， 即 
电 =axr+ 思 +c 
人 
设 /Kx,y) 是 无 畸变 的 原始 图 像 ， 而 g(x,y) 是 /xy) 畸变 结果 ， 这 一 畸变 的 过 程 是 已 
知 的 ， 并 且 用 函数 户 和 用 定义 。 于 是 有 
8G0D)= co (3-72) 
这 说 明 在 图 像 中 本 来 应 该 出 现在 像素 (x,y) 上 的 灰 度 值 由 于 畸变 ， 实 际 上 却 出 现在 
(xz,2) 上 了 。 这 种 失真 的 复原 问题 实际 上 是 映射 变换 问题 。 在 给 定 了 g(x,y) ， 放 (zx 们 ， 
万 (CxDy) 的 情况 下 ， 其 复原 处 理 可 按 如 下 的 方法 进行 。 
1) 对 于 (xz,y) 中 的 每 一 点 (xm, 加 ) ， 找 出 在 gCxc ,7) 中 相应 的 位 置 (xc,P)= [ 放 (Cxo,yo) 
态 (0m, 区 )] 。 由 于 cx 和 不 一 定 是 整数 ， 所 以 通常 (w,) 不 会 与 g(Cx',y) 中 的 任何 点 重合 。 
2) 找 出 g(x,y) 中 与 (c,B) 最 靠近 的 点 (xz,y) ， 并 且 令 1Co,m)=gCd,) ， 也 就 是 把 
g(xz,y) 点 的 灰 度 值 赋予 fx, 加 ) 。 如 此 逐 点 做 下 去 ， 直 到 整个 图 像 ， 则 几何 畸变 得 到 校正 。 
3) 如 果 不 采用 2) 中 的 灰 度 值 的 代 换 方法 ， 也 可 以 采用 内 插 法 。 这 种 方法 是 假定 (cx,D) 
点 找到 后 ， 在 g(Cx',y) 中 找 出 包围 着 (c,B) 点 的 4 个 邻近 的 数字 点 ， (xi ， CGI ， 
(DC ， 并 且 有 





人 寺 到 1 
用 和 D<J 
式 中 ，Gocy) 中 人 Cn, 为) 点 的 灰 度 值 由 g(x',y) 中 4 个 点 的 灰 度 值 间 的 某 种 内 插 法 来 确定 。 

在 以 上 方法 的 几何 畸变 校正 处 理 中 ， 如 果 (c,B) 处 在 图 像 g(x,y) 之 外 ， 则 不 能 确定 其 
灰 度 值 ， 而 且 校正 后 的 图 像 多 半 不 能 保持 其 原来 的 矩形 形状 。 

以 上 讨论 的 是 g ， 为 ， 包 都 知道 的 情况 下 几何 畸变 的 校正 方法 。 如 果 只 知道 g ， 而 广 
和 态 都 不 知道 ， 但 是 若 有 类 似 的 、 规 则 的 网 格 之 类 的 图 案 可 供 参考 利用 ， 那 么 就 有 可 能 通过 
测量 g 中 的 网 格 点 的 位 置 来 决定 畸变 变换 的 近似 值 。 

例如 ， 如 果 给 出 了 3 个 邻近 网 格 点 构成 的 小 三 角形 ， 其 在 规则 网 格 中 的 理想 坐标 为 
0Os) ，(0ao5)，(03,s3) ， 并 设 这些 点 在 g 中 的 位 置 分 别 为 ns) (Gai 交 ) (6 罗 )。 由 线 


《3 





此 =ax+ 思 +c 7 


了 = 必 +@+ 厂 
可 认为 它 把 3 个 点 映射 到 它们 畸变 后 的 位 置 ， 由 此 ， 可 构成 如 下 6 个 方程 
本 =Q1i+Bsi+C 
由 = 办 +esi+ 太 
1 =Q72 十 bs2 十 C (3.75) 
呈 = 咏 +es+ 厂 
23 =a03 十 bs3 +C 


号 = 咏 +es 二 厂 


02> 








解 这 6 个 方程 可 以 求 得 ob,c,d,e,y 。 这 种 变换 可 用 来 校正 g& 中 被 这 3 点 连 线 包围 的 三 
角形 畸变 分 部 。 由 此 对 每 3 个 一 组 的 网 格 点 重复 进行 ， 即 可 实现 全 部 图 像 的 几何 畸变 校正 。 





多 数 的 图 像 复原 技术 都 是 以 图 像 退化 的 某 种 先 验 知识 为 基础 ， 也 就 是 假定 系统 的 脉冲 响 

应 或 点 扩散 函数 是 已 知 的 。 但 是 ， 在 许多 情况 下 难以 确定 图 像 退化 的 点 扩散 函数 。 在 这 种 情 

况 下 ， 必 须 从 观察 图 像 中 以 某 种 方式 抽出 图 像 退 化 信息 ， 从 而 找 出 图 像 复 原 方法 。 这 种 方法 

就 是 所 谓 的 盲目 图 像 复原 。 对 具有 加 性 噪声 的 模糊 图 像 作 盲目 图 像 复 原 的 方法 有 两 种 ， 就 是 

直接 测量 法 和 间接 估计 法 。 

直接 测量 法 盲目 图 像 复 原 通常 要 测量 图 像 的 模糊 脉冲 响应 和 噪声 功率 谱 或 协 方差 函数 。 

在 所 观察 的 景物 中 ， 往 往 点 光源 能 直接 指示 出 冲 激 响应 。 另 外 ， 图 像 边 缘 是 否 陡峭 也 能 用 来 

推测 模糊 冲 激 响应 。 在 背景 高 度 相 对 恒定 的 区 域内 测量 图 像 的 协 方差 可 以 估计 出 观测 图 像 的 

噪声 协 方差 函数 。 

间接 估计 法 盲目 图 像 复 原 类 似 于 多 图 像 平 均 法 处 理 。 例 如 ， 在 电视 系统 中 ， 观 测 到 的 第 

i 帧 图 像 为 

区 (3-76) 

式 中 ，j 丰 (xs 妨 是 原始 图 像 ，gi(x,y) 是 含有 噪声 的 图 像 ， 思 (xz, 妇 是 加 性 噪声 。 如 果 原始 图 像 
在 M 帧 观测 图 像 内 保持 恒定 ， 对 M 帧 观测 图 像 求 和 ， 得 到 的 关系 如 下 

扩 耻 
Ji = 方 半 g(e 有 - 方 半 no (3-77) 


扎 
当 M 很 大 时 ， 式 〈3-77) 右边 的 噪声 项 的 值 趋向 于 它 的 数学 期 望 值 Efn(x,)} 。 一 般 情 
况 下 ， 白 色 高 斯 噪声 在 所 有 (x,?) 上 的 数学 期 望都 等 于 零 ， 因 此 ， 合 理 的 估计 量 是 








的 
co- 十 症 ge 四 (3-78) 


以 上 是 利用 多 幅 相同 的 图 像 进行 平均 以 实现 对 加 性 噪声 的 消除 ， 同 时 ， 盲 目 图 像 复原 的 
间接 估计 法 也 可 以 利用 时 间 上 平均 的 概念 去 掉 图 像 中 的 模糊 。 


3.6 ”运动 模糊 图 像 的 复原 
| 3561 本 世 下 到 ] 


由 于 摄像 机 和 景物 之 间 的 相对 运动 ， 往 往 造成 获取 的 图 像 模糊 。 而 且 很 多 变速 的 非 直线 
运动 在 一 定 条 件 下 可 以 看 成 是 由 均匀 直线 运动 合成 的 ， 因 此 由 均匀 直线 运动 所 造成 的 模糊 图 
像 的 复原 问题 更 具有 普遍 意义 。 

设 图 像 ACx,y) 作 平面 匀速 直线 运动 ， 令 区 (0 惫 (1) 分 别 为 * 和 ?方向 运动 的 随时 间 变 
化 的 分 量 。 如 照相 机 拍照 ， 胶 片上 任 一 点 上 总 曝光 量 是 由 快门 打开 的 时 间 工 内 所 有 曝光 的 积 
分 而 得 ， 设 快门 的 开 、 关 是 肯 时 发 生 的 ， 且 光学 成 像 过 程 是 完善 的 ， 则 有 

goD)=[ 7-mOy-mOHr (3-79) 


请 





对 式 (3-79) 进行 傅 里 叶 变 换 
Goon= 站 站 goy)exp[-jzrGooy)ldxdy 





= 六 六 [7Ee-aOy-mOkrexpFjzrcoowlddy (3-80) 


此 处 积分 次 序 交换 后 得 


cow= 由 | 户 请 7E-aOo-mOleLjnomwnldy]d 
= 人 CrGowexp[-jzroa(O+wm(O)]jdt 


= Fen| epfjznleoC)+w(OO]idr 


则 可 得 到 


Ho 六 = 人 esp 人 jxteo(D+wu(ODd' G3-81) 
Go)= 瑟 oemDFGo) (3-82) 
三世 (3-83) 

万 (v) 


因此 ，xy) 可 由 (wyv) 的 傅 里 叶 变 换 求 得 。 
速 直线 运动 引起 模糊 的 复原 
如 果 模 糊 图 像 是 由 景物 在 x 方向 上 进行 水 平 匀速 直线 运动 造成 的 ， 则 模糊 后 图 像 上 任意 











点 的 值 为 


gc)= 人 VEe-mOyldt G3-84) 
设 图 像 总 的 位 移 为 g， 总 的 运动 时 间 为 7， 则 运动 性 质 为 罗 O= 下 1， 于 是 有 
Mon)= exp[-jzmoa(Djdr = 六 exp[-jzmu2ildr=- 工 sin(mua)expC_jmua) (3-85) 
和 4 玫 Tua 


由 式 (3-85) 可 见 ， 当 # = 三 〈m 为 整数 ) 时 ，Fee 咏 =0， 在 这 些 点 上 无 法 用 逆 滤 波 法 
QQ 


恢复 原 图 像 ， 因 而 需 采 用 其 他 方法 。 


由 于 只 考虑 x 方 向 ，? 是 不 变 的 ， 故 可 暂时 忽略 ”， 式 〈3-84) 可 写成 
se-aOd= 人 -2 地 0<x<Z (为 图 像 的 宽度 ) (3-86) 


令 z=z- 人 tt 则 有 


SG = 工作 ,Godr 
对 上 式 两 边 求 时 ， 有 
&O=ZUCO-7e-a 





TCD = 了 8CO+ Je (3-87) 


式 (3-87) 反映 了 /Co 和 xz-a) 的 递 推 关 系 。 因 为 g'(xz) 、T、a 是 已 知 的 ， 因 此 知道 
了 长 度 为 e 的 区 间 上 的 原始 图 像 ， 就 可 以 推出 整 幅 图 像 ， 可 想 办 法 找 出 一 种 递归 方法 来 复原 
图 像 。 

由 于 图 像 在 x 方向 上 的 定义 域 为 0 和 x 和 工 ， 多 数 情况 下 a << 工 ， 因 而 可 近似 地 认为 
工 = Ka ， 大 为 整数 。 这 样 将 区 间 [0，L] 分 成 天 个 长 度 为 a 的 子 区 间 ， 令 ze[0,a]， 第 普 段 子 
区 间 中 的 x 值 可 以 表示 为 


x=z+ma 丸 =012…, 大 -1 
， 于 是 有 
JJ(z+ma)=cg'(z+ma)+[z+(n-Da] (3-88) 

当 m=0 时 ， 有 JJ(z)=cg'(z)+7(z-a)。 

令 Flz-q=gz)， 则 

=0 时 ， 有 J(z)=wg'(z)+W2) 

凡 =1 时 ， 有 JJ(z+a=cg'(z+a)+CS'(z)+Wz) 。 

以 此 类 推 ， 将 得 到 通 式 


Je+A=cyg(z+kaHgC) G3-89) 
大 一 0 


由 于 g'(Cx) 、c 、a 为 已 知 ， 人 只 需 估计 出 约 z) 即 可 。 
式 (3-89) es ,天 -1， 共 天 项 累计 加 得 


2 < 之 衬 ec+rHkyG) (3-90) 
所 
则 有 
g(2) = 到 攻 Je+na)- 人 全 六 gc+ 稀 (3-91) 
下 天 名 名 


式 〈3-91) 中 右边 第 一 项 虽然 未 知 ， 但 是 当 天 很 大 时 ， 它 趋 于 fx) 的 平均 值 ， 因 此 可 以 把 
第 一 项 求 和 式 视 为 一 个 常量 4， 从 而 有 


硒 曙 了 叶 交合 而 (3-92) 
天 =0f=0 
恢复 图 像 7(z + ma) 为 
7ermaj=4- 人 全 立 ge+ 加 +o 袜 se 网 (3-93) 


霹 操 
由 于 z+ 如 -如 +ma=x， 从 而 六 gz+ 由 = 六 ge-ma+lg)。 再 利用 关系 
扎 扎 


六 ge-ma+ 操 = 六 gCe- 铝 


it=o 


最 后 式 〈3-93) 可 以 表示 成 


说 











AL 





100=4+c 定 ge 人- 允 工 定 g(e- 侣 (3-94) 
名 操 包 
再 引入 去 掉 了 的 变量 >， 则 
ki 
Je-=4+c SC- 人- 号 守 Se- 人知 胃 (3-95) 
咎 和 所 





这 就 是 去 除 由 x 方 向 上 进行 水 平 匀速 直线 运动 造成 的 图 像 模糊 后 恢复 图 像 的 表达 式 
考虑 到 在 计算 机 处 理 中 ， 多 用 离散 形式 的 公式 ， 故 而 将 式 〈3-86) 和 式 〈3-95) 的 离散 


形式 写 为 





Co)= 交 /e-2Ar (3-96) 


扎 


cy)=4+ cx [ee-ktoy )- gc 如 -Ary)]/Ar- 

名 
到 (3-97) 
》 > [gc- 如 )-gC- 如 -Ary)]/Ar 
二 


上 述 运动 模糊 图 像 的 复原 处 理 如 图 3-18 所 示 。 





可 日 
图 3-18 图 像 运动 模 糊 与 去 模糊 实例 


al 原始 图 像 b) 运动 造成 的 图 像 模 糊 c) Wiener 滤波 去 图 像 模 糊 





程序 代码 如 下 : 
% 用 MATLAB 程 上 
[=imread('F:Vimag 





实现 由 于 运动 造成 的 图 像 模 糊 和 去 除 图 像 模糊 的 实例 
swan bmp):; 





figure(1):imshow(D; 
% 设 置 运动 位 移 为 30 个 像素 





动 角度 为 75 

THETA=75; 

% 建 立 二 维 仿真 线性 运动 滤波 器 PSF 
PSF= 人 pecial(motion,LEN.THETA); 
% 用 PSF 产生 退化 图 像 
MEF=imfilter(LPSF,circularvconvy; 
figure(2):imshow(MF); 








00>> 








% 用 Wiener 滤波 消除 运动 模糊 的 图 像 
wnr=deconvwnr(MF,PSF); 
figurejimshow(wnrn); 


3.7 “小结 


图 像 在 形成 、 传 输 和 记录 过 程 中 ， 由 于 受 多 种 原因 的 影响 ， 图 像 的 质量 有 所 下 降 ， 从 而 
引起 图 像 的 退化 。 图 像 复 原 是 指 利 用 退化 现象 的 某 种 先 验 知识 〈 即 退化 模型 )， 对 已 经 退化 
了 的 图 像 加 以 重建 和 复原 ， 使 复原 的 图 像 尽 量 接近 原 图 像 。 因 此 ， 图 像 复原 处 理 的 关键 问题 
是 建立 退化 模型 。 在 对 退化 图 像 进行 复原 处 理 时 ， 如 果 对 图 像 缺乏 足够 的 先 验 知识 ， 可 利用 
已 有 的 知识 和 经 验 对 模糊 或 噪声 等 退化 过 程 进 行 数学 模型 的 建立 及 描述 。 图 像 退 化 过 程 的 先 
验 知识 在 图 像 复 原 技术 中 所 起 的 重要 作用 ， 反 映 到 滤波 器 的 设计 上 ， 也 就 是 相当 于 寻求 点 扩 
散 函 数 的 问题 。 

本 章 在 以 连续 函数 和 离散 函数 两 种 形式 介绍 了 图 像 退 化 的 一 般 模型 后 ， 接 着 按 非 约束 复 
原 方法 、 约 束 复原 方法 和 其 他 几 种 图 像 复 原 技术 对 图 像 退 化 的 复原 技术 进行 了 介绍 。 

非 约 束 复原 方法 仅仅 要 求 某 种 优化 准则 为 最 小 ， 不 考虑 其 他 任何 约束 的 复原 方法 ， 常 用 
的 有 非 约 束 复原 的 代数 方法 和 逆 滤 波 复原 法 。 所 谓 非 约 束 复原 的 代数 方法 是 用 线性 代数 中 的 
理论 解决 图 像 复 原 问 题 。 通 常 选 择 最 小 二 乘 方 作为 优化 准则 的 基础 。 逆 滤波 复原 法 也 叫做 反 
向 滤波 法 ， 其 主要 过 程 是 首先 将 要 处 理 的 数字 图 像 从 空间 域 转换 到 傅 里 叶 频 率 域 中 ， 进 行 反 
向 滤波 后 再 由 频率 域 转换 到 空间 域 ， 从 而 得 到 复原 的 图 像 信 号 

有 约束 图 像 复 原 技术 除了 要 求 了 解 关 于 退化 系统 的 传递 函数 之 外 ， 还 需要 知道 某 些 噪 声 
的 统计 特征 或 噪声 与 图 像 的 某 些 相关 情况 。 根 据 所 了 解 的 噪声 的 先 验 知识 的 不 同 ， 采 用 不 同 
的 约束 条 件 ， 从 而 得 到 不 同 的 图 像 复 原 技术 。 最 常见 的 方法 有 约束 的 最 小 二 乘 方 约束 复 原 原 
法 、 维 纳 滤波 法 ， 有 约束 最 小 平方 复原 和 去 除 由 匀速 运动 引起 的 模糊 。 在 最 小 二 乘 方 约束 复 
原 法 中 ， 为 了 在 数学 上 更 容易 处 理 ， 常 常 附加 某 种 约束 条 件 ， 形 成 不 同 的 约束 条 件 ， 就 可 得 
到 不 同类 型 的 有 约束 最 小 二 乘 方 图 像 复 原 方法 。 维 纳 滤波 是 假设 图 像 信 号 可 近似 看 成 平稳 随 
机 过 程 的 前 提 下 ， 按 照 使 输入 图 像 和 复原 图 像 之 间 的 均 方 误 差 达 到 最 小 的 准则 函数 来 实现 图 
像 复 原 的 方法 。 

除 此 之 外 ， 还 存在 一 些 其 他 的 空间 图 像 复 原 方法 ， 如 几何 畸变 校正 和 言 目 图 像 复原 方法 。 所 
谓 盲目 图 像 复原 法 是 指 从 观察 图 像 中 以 某 种 方式 抽出 退化 信息 ， 从 而 找 出 图 像 复 原 方法 。 对 具有 
加 性 噪声 的 模糊 图 像 进行 盲 目 图 像 复原 的 方法 有 两 种 一 直接 测量 法 和 间接 估计 法 。 

尽管 大 多 数 图 像 整体 上 并 不 稳定 ， 但 有 许多 图 像 可 以 被 认为 是 局 部 平稳 的 ， 另 外 ， 噪 声 
常常 会 限制 一 幅 图 像 的 可 能 复原 程度 ， 特 别 是 在 空间 高 频段 。 总 之 ， 在 这 个 领域 中 还 有 很 多 
工作 要 做 。 


习题 


3-1 画图 简 述 退化 的 基本 模型 ， 并 画 出 框图 
3-2， 试 写 出 连续 退化 模型 ， 并 解释 何 为 冲 激 响应 函数 





<07 


记 





3-3 ” 试 写 出 离散 退化 模型 。 

3-4 什么 是 约束 复原 ? 什么 是 非 约束 复原 ? 在 什么 条 件 下 进行 选择 ? 

3-5 ，” 试 描述 最 小 二 乘 方 复原 法 。 

3-6 用 数码 相机 以 不 同 的 焦距 在 同一 位 置 拍摄 两 张 图 片 ， 试 比较 其 中 透镜 引起 的 几何 





3-7 在 连续 线性 位 移 不 变 系 统 的 维 纳 滤波 器 中 ， 如 果 假 设 噪声 与 信号 的 功率 谱 之 比 为 
吕 =(Goyj1srGoa=|EGov 和 外， 试 求 最 佳 估计 值 六 zx,y) 的 表示 式 
3-8 根据 图 像 运动 模糊 应 用 举例 ， 自 己 动手 试 编写 图 像 移动 不 同 像素 和 角度 的 模糊 效果 。 








第 4 章 图 像 处 理 的 相关 操作 


4.1 图 像 类 型 转换 


在 此 将 对 不 同 图 像 类 型 的 相互 转换 进行 介绍 ， 以 使 读者 对 图 像 类 型 有 一 个 更 加 清晰 
的 认识 。 

在 某 些 图 像 操 作 中 ， 需 要 对 图 像 类 型 进行 转换 。 如 要 对 一 幅 索引 色 图 像 滤 波 ， 首 先 应 将 
它 转换 成 真 彩色 图 像 或 者 灰 度 图 像 ， 再 利用 MATLAB 7.0 对 图 像 的 灰 度 进行 滤波 ， 这 就 是 通 
常 意义 上 的 滤波 。 如 果 不 将 索引 色 图 像 进行 转换 ，MATLAB 7.0 则 对 图 像 调 色 板 的 序号 进行 
滤波 ， 这 没有 任何 意义 。 为 此 ， 下 面 将 对 MATLAB 7.0 图 像 处 理工 具 箱 中 常用 的 类 型 转换 函 
数 进行 说 明 。 

1. ind2rgb() 函 数 

ind2rgb() 函 数 将 索引 图 像 转 换 成 真 彩色 图 像 ， 其 语法 格式 为 

@ RGB= ind2rgb (X，map) 

该 命令 将 具有 调 色 板 map 的 索引 色 图 像 X 转换 成 真 彩色 图 像 RGB， 实 际 实现 时 就 是 产 
生 一 个 三 维 数组 ， 然 后 将 索引 色 图 像 对 应 的 调 色 板 颜 色 值 赋予 三 维 数组 。 输 入 图 像 X 可 以 是 
double 或 uintg 类 型 ， 输 出 图 像 RGB 为 double 类 型 。 

2.mat2gray() 函 数 

mat2gray0) 函 数 用 于 将 一 个 数据 矩阵 转换 成 一 幅 灰 度 图 像 ， 其 语法 格式 为 

@ [mat2gray(A, [amin amax]) 

@@ [mat2gray(A) 

这 里 F-mat2gray(A, [amin amax]) 按 指定 的 取 值 区 间 [amin amax] 将 数据 矩阵 4 转换 为 灰 度 
图 像 [，amin 对 应 灰 度 0〈 最 暗 )，amax 对 应 1〈 最 亮 )。 如 果 不 指 定 区间 [amin amax]， 
MATILAB 7.0 则 自动 将 数据 矩阵 4 中 最 小 的 元 素 设 为 amin， 最 大 元 素 设 为 amax。 

输入 矩阵 4 和 输出 图 像 I 都 是 double 类 型 。 实 际 上 ，mat2gray() 函 数 与 后 面 的 imshow() 
函数 的 功能 类 似 。imshow0) 函 数 也 可 以 使 数据 矩阵 可 视 化 。 以 下 程序 示例 用 sobel 算 子 对 图 
像 滤 波 ， 将 滤波 得 到 的 数据 矩阵 转换 为 灰 度 图 像 ， 转 换 效果 如 图 4-1 所 示 。 


Timread(rice.png); 
Jfilter2(fpecial(sobel7,D; 
K=mat2gray(); 

imshow(D; 

figure， 

imshow(K) 


记 
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图 4-1 数据 矩阵 转换 为 灰 度 图 像 


al 原始 图 像 b) 转换 后 的 图 像 效 果 

3. grayslice() 函 数 

grayslice() 函 数 通过 设 定 闪 值 将 灰 度 图 像 转 换 成 索引 色 图 像 ， 其 语法 格式 为 

@_ X= grayslice(L m) 

@ X= grayslice(L V) 

X= grayslice(L, m) 命 令 将 灰 度 图 像 I 均 匀 量 化 为 n 个 等 级 ， 然 后 转换 为 伪 彩 色 图 像 又 。X 
=grayslice(L, v) 命 令 则 按 指定 的 阔 值 向 量 v〈 每 一 个 元 素 都 在 0 一 1 之 间 ) 对 图 像 工 的 值 域 进 行 
划分 ， 而 后 转换 成 索引 色 图 像 X。 

输入 图 像 I 可 以 是 double 或 uintg 类 型 。 如 果 闪 值 数量 小 于 256， 则 返回 图 像 X 的 数据 
类 型 是 uintg，X 的 值 域 为 [0.n] 或 [O.length(V)]， 和 否则 ， 返 回 图 像 X 为 double 类 型 ， 值 域 为 
[Lan+l] 或 [Olength(V)+H]。 以 下 程序 代码 示例 将 一 幅 灰 度 图 像 转 换 成 索引 色 图 像 ， 转 换 效 果 
如 图 4-2 所 示 。 





imread(snowflakes-png); 
X=grayslice(L.16); 
imview() 
imview(Xjet(16) 


Image Tool 1 - (了 ATLAB Expressi 
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图 4-2 ”把 灰 度 图 像 转换 成 索引 色 图 像 
al 灰 度 图 像 b) 索引 色 图 像 











4. rgb2gray() 函 数 

rgb2gray0O 函 数 用 于 将 一 幅 真 彩色 图 像 转 换 成 灰 度 图 像 ， 其 语法 格式 为 

@ [=rgb2gray(RGB) 

@ newmap=rgb2gray(map) 

其 中 ，[= rgb2gray(RGB) 命 令 将 真 彩色 图 像 RGB 转换 成 灰 度 图 像 IT， 而 newmap=rgb2 
gray(map) 则 将 彩色 调 色 板 map 转换 成 灰 度 调 色 板 。 

如 果 输入 的 是 真 彩色 图 像 ， 图 像 可 以 是 uintg 或 double 类 型 ， 输 出 图 像 I 与 输入 图 像 类 
型 相同 。 如 果 输 入 是 调 色 板 ， 则 输入 和 输出 的 图 像 都 是 double 类 型 。 

5. rgb2ind() 函 数 

rgb2ind() 函 数 将 RGB 图 像 转 换 成 索引 色 图 像 ， 其 调用 格式 为 

@ [X, map]= rgb2ind(RGB,toD) 

@ _[X, map]= rgb2ind(RGB,m) 

@_[X, map]= rgb2ind(RGB,map) 

@ […]=rgb2ind(….,dither_option) 

支持 的 输入 图 像 类 型 有 uintg、uint16 和 double。 如 果 map 的 长 度 小 于 或 等 于 256， 则 输 
出 图 像 的 类 型 为 uint8。 和 否则 ， 输 出 图 像 类 型 为 uint16。 以 下 程序 代码 说 明了 该 函数 的 使 用 情 
况 ， 转 换 效 果 如 图 4-3 所 示 。 


RGB=imread(peppers.png); 
imshow(RGB); 
[Xsmap]=-rgb2ind(RGB,128); 
figure; 


imshowCXmap) 





图 4-3 RGB 图 像 转换 成 索引 色 图 像 


下 原始 RGB 图 像 b 索引 色 图 像 
6. im2bw() 函 数 
im2bw() 函 数 通过 设置 亮度 阔 值 将 真 彩色 、 索 引 色 、 灰 度 图 像 转换 成 二 值 图 ， 其 语法 
格式 为 
@ BW=im2bw(Llevel) 
@ BW=im2bw(X,map,level) 


训 
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@ BW=im2bw(RGB,leveD 

以 上 三 行 命令 分 别 将 灰 度 图 像 、 索 引 色 图 像 和 真 彩色 图 像 二 值 化 为 图 像 BW。Level 是 
归 一 化 的 阔 值 ， 取 值 在 [0,1] 之 间 。 输 入 图 像 可 以 是 double 或 uint8 类 型 ， 输 出 图 像 为 uintg 类 
型 。 以 下 程序 代码 示例 对 一 幅 图 像 进行 二 值 化 处 理 ， 处 理 结果 如 图 4-4 所 示 。 


load trees 
BW=im2bw(X,map,0.4); 
imshow(Xsmap) 
figure,imshow(BW) 





图 4-4 ”一 幅 图 像 进行 二 值 化 处 理 后 的 结果 


a 索引 色 图 像 b 二 值 化 后 的 图 像 
7. ind2gray() 函 数 
ind2gray0O 函 数 将 索引 色 图 像 转换 为 灰 度 图 像 ， 其 调用 格式 为 
@ [ind2gray(X, map) 
该 命令 行将 具有 调 色 板 map 的 索引 色 图 像 I 转换 成 灰 度 图 像 1， 去 掉 了 图 像 的 色 度 和 饱 
和 度 ， 仅 保留 了 图 像 的 亮度 信息 。 输 入 图 像 可 以 是 double 或 uint8 类 型 ， 输 入 图 像 为 double 
类 型 。 以 下 程序 代码 将 一 幅 索引 色 图 像 转 换 成 灰 度 图 像 ， 结 果 如 图 4-5 所 示 。 








图 4-5 一 幅 索引 色 图 像 转 换 成 灰 度 图 像 


a 索引 色 图 像 b) 转化 后 的 灰 度 图 像 








程序 代码 如 下 : 


load trees 
=ind2gray(X,map); 


imshow(CX,map) 全 
figurejimshow(D) 
8. dither() 函 数 


通过 拉动 来 转换 图 像 ， 增 加 图 像 的 颜色 对 比 度 。dither() 函 数 的 调用 格式 为 
@ X=dither (RGB, map) 
@ BW=dither (D) 
这 里 输入 图 像 可 以 是 double 或 uintg 类 型 。 如 果 输 出 的 图 像 是 二 值 图 像 或 颜色 种 类 不 超 
过 256 的 索引 色 图 像 ， 则 是 uint8 类 型 ， 否 则 为 double 类 型 。 以 下 以 一 幅 索引 色 图 像 持 动 为 
uint8 类 型 图 像 ， 程 序 代码 如 下 : 
RGB-imread(peppers.png'); 
[Xsmap]-rgb2ind(RGB,256); 
I=dither(RGB,map); 
BW=dither(D); 
% 显 示 索 引 色 图 像 如 图 4-6 所 示 
imshow(RGB,map); 
figure; 
%% 显 示 拌 动 转换 图 像 如 图 4-7 所 示 
imshow(BW) 








图 4-6 索引 色 图 像 图 4-7 拌 动 转换 图 像 
4.2 图 像 数据 结构 
模式 
1 灰 度 图 像 


灰 度 图 像 是 数字 图 像 最 基本 的 形式 ， 灰 度 图 像 可 以 由 黑白 照片 数字 得 到 ， 或 对 彩色 图 像 














个 字 节 〈8 个 二 进 制 位 ) 来 存储 灰 度 值 。 典 型 的 灰 度 图 像 如 图 4-8 所 示 。 

如 果 灰 度 值 用 1 个 字 节 表 示 ， 则 可 以 表示 的 正 整数 范围 是 0 一 255， 也 就 是 说 ， 像 素 灰 
度 值 的 取 值 在 0 一 255 之 间 ， 灰 度 级 数 为 256。 人 力 通常 在 20 一 60 级 ， 因 
此 ， 灰 度 值 以 字 单位 存储 既 保证 了 人 眼 的 分 辨 能 力 ， 又 符合 计算 机 数据 寻 贯 。 在 
特殊 应 用 中 ， 可 采用 更 高 的 灰 度 级 数 ， 如 CT 全 厅 达 数 干 用 12 
位 或 16 位 二 进 制 位 存储 数据 ， 但 这 类 图 像 通常 都 采用 专用 的 显示 设备 和 软件 来 进行 显示 和 
处 理 。 

2. 二 值 图 像 

值 图 像 是 灰 度 图 像 经 过 二 值 化 处 理 的 结果 ， 二 值 图 像 只 有 两 个 灰 度 级 ， 理 论 上 只 需 
要 1 个 二 进 制 位 来 表示 。 在 文字 识别 、 图 样 识 别 等 应 用 中 ， 灰 度 图 像 一 般 要 经 过 二 值 化 处 
理 得 到 二 值 图 像 ， 二 值 图 像 中 的 黑 和 白 分 别 用 来 表示 不 需要 进一步 处 理 的 背景 和 需要 进 
步 处 理 的 前 景 目标 ， 以 便 对 目标 进行 识别 。 图 4-9 所 示 为 图 4-8 经 过 二 值 化 处 理 后 得 到 的 
值 图 像 。 






















图 4-8 灰 度 图 像 图 4-9 二 值 图 像 


3. 彩色 图 像 

彩色 图 像 的 数据 不 仅 包 含 亮度 信息 ， 还 要 包含 颜色 信息 。 颜 色 的 表示 方法 是 多 样 化 的 ， 
最 常见 的 是 三 基色 模型 ， 如 RGB (Red/Green/Blue， 红 / 绿 / 蓝 ) 三 基色 模型 ， 利 用 RGB 三 基 
色 可 以 混合 成 任意 颜色 。 因 此 ，RGB 模型 在 各 种 彩色 成 像 设 备 和 彩色 显示 设备 中 使 用 ， 常 
色 图 像 也 都 是 用 RGB 三 基色 来 表示 的 ， 每 个 像素 包括 红 / 绿 / 蓝 三 种 颜色 的 数据 ， 每 个 
1 个 字 节 〈8 位 二 进 制 位 ) 表示 ， 则 每 个 像素 的 数据 为 3 个 字 节 《〈 即 24 位 二 进 制 
的 24 位 真 彩色 。 


是 
E 闪 esa | 

1. 颜色 分 析 

在 MATLAB 7.0 图 像 处 理工 具 箱 中 ， 总 是 直接 (RGB 图 像 ) 或 者 间接 〈 索 引 色 图 像 ) 
地 使 用 RGB 数据 来 表示 颜色 。 但 是 除了 RGB 颜色 模型 之 外 ， 还 有 许多 其 他 颜色 模型 ， 如 
HSV 模型 等 ， 这 些 不 同 的 颜色 模型 就 构成 了 所 谓 间 。 

颜色 模型 是 二 维 颜色 空间 中 的 一 个 可 见 光 子 集 ， 它 包括 某 个 颜色 域 的 所 有 颜色 。 常 用 的 
颜色 模型 有 NTSC (YIQ 颜色 空间 )、HSV 和 YCBCR 模型 等 。 下 面 将 主要 对 RGB 颜色 空间 
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像 处 理 的 相关 


和 YIQ 颜色 空间 进行 简单 的 介绍 。 
(1) RGB 颜色 空间 简介 
RGB 颜色 空间 是 显示 和 保存 彩色 图 像 的 最 常用 的 彩色 空 
间 ， 由 R ( 红 )、G ( 绿 ) 和 B《〈 蓝 ) 3 个 分 量 组 成 ， 三 维 空间 
中 的 3 个 轴 分 别 与 之 对 应 。 原 点 对 应 黑色 ， 离 原点 最 远 的 项 点 
对 应 白色 ， 其 他 颜色 落 于 三 维 空间 中 。 由 红 、 绿 和 蓝 三 原色 组 
成 的 彩色 立方 体 如 图 4-10 所 示 。 
(2) YIQ 颜色 空间 简介 
YIQ 颜色 空间 来 源 于 国家 电视 标准 委员 会 (NTSC 制式 ) 
彩色 电视 信号 的 传输 ， 其 中 的 Y 分 量 代表 图 像 的 亮度 信息 ，I、 
Q 两 个 分 量 则 代表 颜色 信息 ，I 分 量 代表 从 橙色 到 青色 的 颜色 变换 ， 而 Q 分 量 则 代表 从 紫色 
到 黄 绿色 的 颜色 变化 。 
通过 把 彩色 图 像 从 RGB 颜色 空间 转换 到 YIQ 颜色 空间 ， 可 以 把 彩色 图 像 中 的 亮度 信息 
与 色 度 信息 分 开 ， 从 RGB 颜色 空间 到 YIQ 颜色 空间 的 转换 公式 为 


污 0299 .04587 ”0.1141 | 及 
业 x| G (4-1) 
Q B 


0.596 -0.274 -0.322 
0.212 -0.523 ”0.311 
2. 图 像 处 理工 具 箱 中 的 颜色 转换 函数 
(1) rgb2ntsc0) 了 数 

将 RGB 颜色 空间 转换 成 NTSC 颜色 空间 ， 使 用 rgb2ntsc0 函 数 ， 其 调用 格式 为 

@ yiqmap=rgb2ntsc (rgbmap) 

@ YIQ= rgb2ntsc (RGB) 

这 里 yiqmap=regb2ntsc (rgbmap) 将 RGB 空间 中 mx3 的 色彩 表 rgbmap 转换 成 YIQ 颜色 空 
间 中 的 调 色 板 yiqmap。YIQ= rgb2ntsc (RGB) 将 真 彩色 图 像 RGB 转换 为 YIQ 颜色 空间 中 的 图 
像 YIQ。 

(2) ntsc2rgb() 函 数 

ntsc2rgb() 函 数 用 于 将 NTSC 值 转换 到 RGB 颜色 空间 ， 其 调用 格式 为 

@ ITgbmap=ntsc2rgb (yiqmap) 

@_ RGB=ntsc2rgb (YIQ) 

(3) rgb2hsv() 函 数 
rgb2hsv0) 函 数 用 于 将 RGB 模型 转换 成 HSV 模型 ， 其 调用 格式 为 
@ cmap=rgb2hsv(M) 











图 4-10 颜色 的 RGB 空间 








@ hsv_image=rgb2hsv(rgb_image) 

这 里 cmap=rgb2hsv(MD) 是 将 真 彩色 图 像 M 转换 为 HSV 颜色 空间 中 的 图 像 HSV。 
hsv_image=rgb2hsv(rgb_image) 将 RGB 颜色 空间 中 mx3 的 颜色 表 rgb_image 转换 成 HSV 颜色 
室 间 中 的 调 色 板 hsv_image。 

(4) hsv2rgb(0) 函 数 
hsv2rgb() 函 数 用 于 将 HSV 模型 转换 为 RGB 模型 ， 其 调用 格式 为 
@_ M=hsv2rgb (H) 








@ ITgb_image=hsv2rgb (hsv_image) 
《5) ycbcr2rgb 

ycbcr2rgb0 函 数 用 于 将 YCBCR 模型 转换 成 RGB 模型 ， 其 调用 格式 为 

@ rgbmap=ycbcr2rgb(ycbcrmap) 

@ RGB=ycbcr2rgb(YCBCR) 

TIgbmap=ycbcr2rgb(ycbcrmap) 将 YCBCR 空间 中 的 调 色 板 ycbcrmap 转换 成 RGB 空间 中 的 
色彩 表 rgbmap。RGB=ycbcr2rgb(YCBCR) 将 YCBCR 空间 中 的 图 像 YCBCR 转换 为 真 彩色 图 
像 RGB。 


EE5 数据 存储 的 数据 结构 | 


数字 图 像 可 以 用 矩阵 来 表示 ， 因 此 可 以 采用 矩阵 理论 和 和 矩阵 算法 对 数字 图 像 进行 分 析 和 
处 理 。 最 典型 的 例子 是 灰 度 图 像 ， 如 图 4-11 所 示 。 灰 度 图 像 的 像素 数据 就 是 一 个 矩阵 ， 和 矩 
阵 的 行 对 应 图 像 的 高 〈 单 位 为 像素 )， 拢 阵 的 列 对 应 图 像 的 宽 〈 单 位 为 像素 )， 矩 阵 的 元 素 对 
应 图 像 的 像素 ， 和 矩阵 元 素 的 值 就 是 像素 的 灰 度 值 。 注 意 : 按照 C 语言 的 习惯 ， 图 像 矩 阵 左 上 
角 的 坐标 取 (0，0)。 
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图 4-11 数字 图 像 与 图 像 矩 阵 


由 于 数字 图 像 可 以 表示 为 矩阵 的 形式 ， 所 以 在 计算 机 数字 图 像 处 理 程序 中 ， 通 常用 二 维 
数组 来 存放 图 像 数据 ， 如 图 4-12 所 示 。 二 维 数组 的 行 对 应 图 像 的 高 ， 二 维 数组 的 列 对 应 图 





























像 的 宽 ， 二 维 数组 的 元 素 对 应 图 像 的 像素 ， 二 维 数组 元 素 的 值 就 是 像素 的 灰 度 值 。 采 用 二 维 
数组 来 存储 数字 图 像 ， 符 合 二 维 数组 的 行列 特性 ， 同 时 也 便于 程序 的 寻 址 操作 ， 使 计算 机 图 
像 编 程 十 分 方便 。 
N 列 
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图 4-12 数字 图 像 与 二 维 数组 








4.3 ”线性 系统 和 移 不 变 系统 


工程 技术 中 所 应 用 的 绝 大 多 数 系统 在 其 工作 范围 内 ， 其 数学 模型 一 般 都 可 以 简化 为 线性 





系统 。 这 不 仅仅 是 因为 线性 系统 在 理论 上 具有 成 熟 的 理论 体系 ， 更 是 因为 各 种 应 用 系统 
(包括 各 种 工业 应 用 系统 ) 在 工作 点 附近 其 实际 运行 状态 非常 接近 于 理想 的 线性 系统 。 因 
此 ， 线性 系统 常用 于 描述 电路 系统 、 光 学 系统 、 机 械 系统 、 液 压 系统 等 。 线 性 系统 理论 为 

号 处 理 s 图 像 处 理 、 生 产 自 动 化 、 信 号 采样 与 滤波 以 及 空间 4 分 辩 率 的 研究 提供 了 坚 











实际 系统 ， 当 给 定 一 个 输入 信号 x(t) ， 则 产生 相应 的 输出 信号 >(D) ， 系 统 的 输入 
信号 与 输出 信号 之 间 实质 上 是 一 种 数学 运算 ， 可 以 采用 如 图 4-13 所 示 的 应 用 系统 模型 表示 。 








MD) 实际 应 用 系统 MD 
cs 《线性 系统 ) 
JJ [xD] 











图 4-13 ”应 用 系统 模型 


即 系统 对 输入 信号 x(t) 的 作用 产生 了 输出 信号 Y(t) ， 这 种 输入 信号 与 输出 信号 之 间 的 关 
系 可 以 采用 函数 运算 的 形式 加 以 描述 : 
DO= TIu(O] 〈4-2) 


对 于 某 一 系统 ， 若 给 定 输入 信号 zi(D) ， 则 产生 输出 信号 蕊 (D) ， 即 


DOD=A[uD] =L2… (4-3) 
当 且 仅 当 该 系统 具有 如 下 性 质 时 : 
(DO+ 六 (DO=JIom(D+ata(O=a7Ta(C]+a 7 人 CO 人 
该 系统 才 是 线性 的 。 






上 述 性 质 表 示 线 性 系统 应 该 满足 耕 加 原理 ， 即 若 输入 信号 是 N 个 信号 的 线性 加 权 组 合 ， 
则 输出 信号 是 对 上 述 信号 中 每 一 个 信号 进行 同样 的 线性 组 合 。 释 加 原理 实际 上 包含 了 两 个 性 
质 ， 即 可 加 性 和 齐 次 性 〈 又 称 为 比例 性 )。 









对 于 任何 一 个 系统 ， 若 给 定 输入 信号 x(D) ， 则 产生 输出 信号 (0 ， 即 


?DO= IOD] (4-5) 
将 输入 信号 自 变量 ! 沿 坐标 轴 平 移 了 时 刻 ， 若 满足 以 下 条 件 : 
JI-7T=-DD) (4-6) 


即 输出 信号 的 函数 形式 不 变 ， 仅 仅 是 输出 信号 的 自 变量 平移 了 同样 的 长 度 7， 则 称 该 系 
统 具有 移 不 变性 ， 或 称 其 为 移 不 变 系统 。 
因此 ， 移 不 变 系 统 是 指 系统 对 于 输入 信号 xD) 产生 输出 信号 (2) ， 若 输入 信号 为 





刘 








add -7T) 时 ， 则 对 应 的 输出 信号 为 yt -T) ， 也 就 是 说 输入 信号 延 时 任意 时 刻 7T， 而 幅 值 却 保 
持 不 变 。 若 线性 系统 满足 移 不 变性 ， 则 称 其 为 线性 移 不 变 系统 。 


4.4 调用 信号 分 析 


为 了 进一步 研究 线性 系统 输入 、 输 出 信号 之 间 的 规律 和 特性 ， 可 以 从 研究 线性 系统 对 复 
指数 函数 的 响应 着 手 。 虽 然 实际 系统 的 输入 、 输 出 信号 一 般 都 是 实数 ， 但 复 指数 函数 的 实 部 
和 虚 部 分 别 是 余弦 信号 和 正弦 信号 ， 它 们 都 是 工业 应 用 中 的 典型 信号 形式 。 因 此 ， 复 指数 信 
号 对 线性 系统 的 研究 具有 重要 的 意义 。 


观察 式 〈4-7) 中 的 复 指数 信号 ， 
MD = cos(oD) + jsin(or) = eiw (4-7) 
趟 中 ， 闻 =i， 
函数 wx(0) 称 为 调谐 信号 ， 它 是 一 个 复 函 数 。 余 弦 信 号 和 正弦 信号 分 别 是 调谐 信号 的 实 部 
和 虚 部 。 


琵 风 汪 对 调谐 信号 的 响应 


对 于 线性 移 不 变 系 统 ， 若 输入 调谐 信号 z(D ， 即 


(= cos(OD) + jsin(oD =e (4-8) 
则 系统 响应 为 
肌 (D= 囊 (osDe (4-9) 
若 输入 调谐 信号 z(D ， 即 
za(D)= cos(OU -7T))+jsin(od 一 7)=eio 7 (4-10) 
则 系统 响应 为 
Jp(D)= 克 (oft-T)eie (4-11) 


由 于 输入 信号 (0D) 和 z(D) 存在 以 下 关系 


iD=eiera(D 


因此 可 得 
ee7NM(D=en (onDe = 力 (D 二 
肋 (D= 吾 (oO,Deiee 
比较 式 (4-11) 和 (4-12)， 得 到 
古 (ox-T)e-iot-7 = 万 (of)eioC -7 (4-13) 
即 
瑟 (o,t 一 7T) = 万 (w, 人 1 《4-14) 


式 (4-14) 中 由 于 了 了 取 任 意 值 均 成 立 ， 因 此 ， 当 万 (o,D) 与 + 无 关 时 ， 上 式 才能 成 立 ， 由 








此 可 得 出 


厅 (oD= 厅 (oO) (4-15) 
因此 ， 可 得 
3D= 瑟 (ou (4-16) 
式 (4-16) 表明 ， 线 性 移 不 变 系统 对 于 调谐 信号 的 响应 等 于 输入 信号 乘 以 一 个 函数 
五 (o) ， 该 函数 仅仅 是 频率 函数 ， 即 线性 系统 的 调谐 信号 输入 总 产生 同样 频率 的 调谐 信号 
输出 。 


4.4 





1. 传递 函数 的 形式 
对 于 线性 移 不 变 系统 ， 式 〈4-16) 描述 了 输入 信号 与 输出 信号 之 间 的 关系 ， 其 中 厂 (w) 
称 为 系统 的 传递 函数 。 传 递 函数 瑟 (w) 包含 了 所 表示 系统 的 全 部 特征 。 
因此 ， 瑟 (o) 可 表示 为 如 下 形式 
Fr(o)=2O (4-17) 
2M(D) 

式 〈4-17) 可 写成 极 坐标 形式 

厅 (@o) = 4(O)eige) (4-18) 
2. 线性 移 不 变 系统 对 余弦 信号 的 输出 
若 输入 为 一 个 余弦 信号 ， 且 令 其 为 某 调谐 信号 的 实 部 ， 即 


au(D= Re[cos(of)+ jsin(ob]= Re(eio) (4-19) 
则 由 于 系统 对 调谐 输 入 信号 的 响应 为 
感 (ojeiw = 4(ojeigoeiw = 4(O)eitee 几 (4-20) 


1 





因此 ， 系 统 的 实际 输出 信号 为 
DOD=Re[d(o)eiecm]= 4d(o)cos(ot+ 婴 (4-21) 

4(w) 为 系统 的 增益 因子 ， 代 表 系 统 对 输入 信号 的 缩放 比例 。 乡 为 输出 信号 的 相位 ， 其 
作用 是 将 调谐 输入 信号 的 时 间 坐 标 加 以 平移 。 

综 上 所 述 ， 线 性 移 不 变 系统 具有 以 下 性 质 : 

1) 调谐 信号 输入 产生 同 频率 的 调谐 信号 输出 。 

2) 系统 的 传递 函数 是 一 个 仅 依赖 于 频率 的 复 函 数 ， 它 包含 了 系统 的 全 部 特征 信息 。 

3) 传递 函数 对 调谐 输入 信号 仅 产生 幅 值 的 缩放 和 相位 的 平移 。 


4.5 ”数字 图 像 的 显示 特性 


一 般 而 言 ， 图 像 显示 是 数字 图 像 处 理 的 最 后 一 个 步 又， 对 图 像 所 进行 的 各 种 处 理 完 成 之 
后 ， 需 要 通过 显示 环节 将 数字 图 像 转换 为 便于 视觉 观看 的 形式 。 


四 图像 的 屏幕 显示 


数字 图 像 是 通过 光栅 扫描 方式 和 计算 机 内 的 帧 缓冲 存储 器 在 计算 机 屏幕 上 进行 显示 的 。 
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任何 一 台 具 有 显示 功能 的 计算 机 内 都 设 有 专门 用 于 存储 图 像 信 息 的 帧 缓冲 存储 器 ， 计 算 
机 时 刻 自 动 监测 该 存储 器 ， 如 果 帧 缓冲 存储 器 内 被 写 入 图 像 数据 ， 则 这 些 数据 会 自动 经 光栅 
扫描 方式 映射 到 计算 机 显示 屏幕 上 ， 从 而 形成 数字 图 像 。 帧 缓冲 存储 器 中 的 每 一 位 对 应 屏幕 
上 的 一 个 点 ， 当 某 一 位 上 的 数据 被 置 为 1 时 ， 与 该 数据 位 对 应 的 计算 机 屏幕 上 的 相应 坐标 位 
置 上 就 出 现 一 个 亮点 ， 而 数据 位 为 0 时 ， 屏 幕 上 的 相应 坐标 位 置 则 产生 一 个 瞳 点 。 计 算 机 开 
始 启动 时 ， 帧 缓冲 存储 器 上 所 有 的 位 被 自动 置 为 0， 当 读 入 图 像 数 据 后 ， 帧 缓冲 存储 器 上 会 
根据 图 像 数 据 的 每 一 位 分 别 置 0 或 置 1。 

例如 ， 若 一 台 计算 机 的 显示 器 分 辨 率 设 定 为 640 像素 x480 像素 ， 为 显示 一 幅 二 值 图 像 需 
要 640x480 位 的 帧 缓存 容量 ， 这 个 容量 称 为 一 个 位 平面 。 因 此 ， 如 果 要 显示 一 幅 256 灰 度 级 
的 单 色 图 像 ， 则 需要 配置 8 个 位 平面 ， 即 需要 640x480 字 节 的 帧 缓存 容量 。 若 显示 器 设置 为 
800 像素 x600 像素 、1024 像素 x768 像素 或 1280 像素 x1024 像素 等 高 分 辨 率 ， 则 所 需 的 帧 组 
存 容 量 要求 相 应 增 大 。 若 需要 显示 R、G、B 均 为 256 级 的 真 彩 色 图 像 ， 则 需要 进行 R、G、 
B 三 色 合 成 ， 因 此 帧 缓存 的 容量 是 单 色 256 灰 度 级 显示 容量 的 3 倍 。 

若 操作 系统 允许 用 户 对 显示 器 的 分 辨 率 进行 设置 ， 则 应 充分 考虑 计算 机 现 有 的 帧 缓存 容 
量 的 容许 范围 。 例 如 ， 当 现 有 帧 缓存 的 容量 为 S12KB 时 ， 为 显示 256 灰 度 级 的 单 色 数字 图 
像 ， 最 多 只 能 选用 800 像素 x600 像素 的 分 辨 率 。 如 果 选 用 1024 像素 x768 像素 的 分 辨 率 ， 则 
图 像 的 灰 度 级 将 降 至 16 个 等 级 ， 即 4bit 图 像 。 可 以 通过 增设 帧 缓存 的 容量 为 获取 较 大 的 分 
辨 率 ， 需 要 注意 的 是 ， 若 显示 器 不 具备 显示 较 高 分 辨 率 的 能 力 ， 即 使 配置 了 足够 的 帧 缓存 ， 
也 仍然 不 能 得 到 高 的 分 辨 率 。 

熟悉 帧 缓冲 存储 器 的 原理 和 作用 之 后 ， 则 可 以 通过 直接 向 帧 缓存 填写 图 像 数据 来 显示 图 
像 。 需 指出 的 是 ， 每 一 个 像素 上 的 数据 在 帧 缓存 上 是 以 位 〈bit) 为 单位 描述 的 ， 而 计算 机 中 
数据 的 输入 和 输出 一 般 以 字 节 〈byte) 为 单位 ， 因 此 图 像 数 据 中 的 每 一 个 字 节 对 应 显示 画面 
上 横向 排列 的 8 个 像素 。 


图 像 需 通过 屏幕 显示 人 眼 才 可 以 观察 到 ， 但 图 像 的 显示 效果 是 由 显示 图 像 的 大 小 、 光 
度 、 分 辨 率 、 低 频 响 应 、 高 频 响应 、 点 间距 和 噪声 特性 等 因素 决定 的 。 

1， 显示 图 像 的 大 小 

图 像 显示 系 统 显 示 图 像 尺 寸 的 能 力 包 括 显示 器 物理 尺寸 和 系统 可 处 理 的 数字 图 像 大 小 两 
个 方面 。 显 示 器 自身 的 物理 尺寸 显然 决定 了 可 显示 图 像 的 大 小 ， 因 此 它 应 该 尽 可 能 大 ， 以 便 
观察 和 理解 所 显示 的 图 像 。 显 示 系 统 能 处 理 的 最 大 数字 图 像 尺寸 是 图 像 处 理 系统 的 主要 指标 
之 一 ， 显 示 器 物理 斥 寸 大 小 不 足 会 降低 整个 图 像 处 理 的 效果 ， 显 示 器 的 物理 尺寸 必须 与 待 处 
理 和 显示 的 最 大 图 像 的 行 数 及 每 行 像素 数 相 适应 。 

2. 光度 分 辨 率 

显示 系统 的 光度 分 辩 率 是 指 系统 在 每 个 像素 位 置 产生 正确 的 亮度 或 光 密 度 的 精度 。 特 别 
重要 的 是 ， 显 示 数 字 图 像 时 系统 所 能 产生 的 离散 灰 度 级 数目 ， 它 部 分 依赖 于 控制 每 个 像素 亮 
度 的 位 数 。 如 果 显 示 器 只 能 处 理 4bit 数据 ， 则 只 能 产生 16 种 不 同 的 灰 度 级 。 相 应 地 ， 如 果 
显示 器 可 以 处 理 8bit 数据 ， 则 表示 能 产生 256 种 灰 度 级 。 

需要 指出 的 是 ， 设 计 一 个 能 接收 gbit 数据 的 显示 器 并 不 等 同 于 可 以 制造 一 个 能 真正 、 可 
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靠 地 显示 256 种 不 同 灰 度 级 的 系统 。 

如 果 显 示 系 统 内 部 的 电子 噪声 达到 或 超过 一 个 以 上 的 灰 度 级 范围 时 ， 那 么 显示 系统 灰 度 
级 的 有 效 数 目 就 会 有 一 定 程度 的 减少 。 一 个 简单 的 经 验 估计 方法 是 根据 方 均 根 (RMS) 噪声 
进行 计算 ，RMS 噪声 级 决定 了 灰 度 分 辨 率 的 实际 下 限 。 例 如 ， 若 RMS 噪声 达到 从 黑 到 白 总 
的 显示 范围 的 1%， 则 该 显示 器 的 实际 灰 度 级 可 以 认为 只 具有 100 级 灰 度 的 光度 分 辩 率 ， 即 
使 显示 系统 接受 8bit 数据 ， 它 也 只 有 100 个 有 效 灰 度 级 。 因 此 ， 有 效 灰 度 级 数 绝对 不 会 多 于 
数字 数据 中 的 灰 度 级 数 ， 而 很 可 能 会 少 一 些 。 

3. 灰 度 的 线性 特性 

灰 度 的 线性 特性 是 一 个 非常 重要 的 显示 特性 指标 ， 它 的 含义 是 显示 图 像 的 亮度 或 密度 正 
比 于 输入 灰 度 级 的 程度 。 任 何 显示 设备 都 有 一 条 输入 灰 度 级 与 输出 亮度 的 变换 曲线 。 为 了 进 
行 正确 的 运算 操作 ， 这 条 曲线 应 当 是 线性 的 ， 并 且 保 持 恒 定 。 对 包含 〈 需 经 显影 及 放大 的 ) 
胶片 记录 器 的 永久 性 显示 设备 来 说 ， 必 须 有 精细 的 质量 控制 方 能 得 到 再 现 的 结果 。 

需要 指出 的 是 ， 人 眼 并 不 是 精确 的 光度 计 ， 如 果 转 换 曲 线 中 存在 轻 度 的 非 线性 ， 以 及 从 
图 像 的 一 侧 到 另 一 侧 10% 一 20% 的 亮度 阴影 渐变 是 很 难 被 视觉 所 捕获 的 。 但 如 果 变 换 曲线 的 
两 端 有 明确 肩 部 〈 或 趾 部 )， 则 在 亮 区 (或 暗 区 ) 可 能 会 丢失 信息 或 导致 图 像 质量 下 降 。 

4 显示 标定 

在 使 用 电视 监视 器 进行 暂时 性 显示 时 ， 变 换 曲 线 部 分 依赖 于 监视 器 的 亮度 和 对 比 度 旋钮 
的 调整 位 置 。 硬 拷贝 印 制 机 一 般 在 前 面板 或 后 面板 上 有 一 个 以 上 的 调节 钮 。 有 时 ， 它 们 包括 

-个 用 来 调整 非 线性 变换 曲线 形状 的 设 定 旋钮 。 这 样 就 让 用 户 能 修改 非 线性 变换 曲线 以 适合 
他 们 的 特殊 要 求 或 个 人 习惯 。 在 大 多 数 情况 下 ， 这 些 处 理应 该 是 由 软件 而 不 是 由 显示 系统 来 
完成 的 显示 系统 仅 起 把 数据 无 附加 “增强 ”地 显示 给 操作 者 的 作用 。 

显示 标定 能 保证 所 显示 的 图 像 正 确 地 表达 该 数字 图 像 。 一 幅 包含 所 有 灰 度 级 的 线条 (或 
正方 形 ) 灰 度 测试 卡 被 显示 在 监视 器 上 或 送 往 图 像 记 录 器 ， 然 后 调整 不 同 的 设置 以 使 全 部 亮 
度 范围 都 可 见 ， 并 且 在 两 端 均 没 有 灰 度 级 的 丢失 。 一 个 图 像 处 理 系统 经 过 合理 的 显示 标定 
后 ， 从 硬 拷贝 记录 器 印 制 出 的 结果 就 与 屏幕 上 显示 的 图 像 看 起 来 正好 一 样 ， 而 且 它 也 是 数字 
图 像 数 据 的 精确 表达 。 

5 低频 响应 

低频 响应 本 质 上 是 指 显示 系统 再 现 大 块 等 亦 度 级 区 域 〈 平 坦 区 域 ) 的 能 力 。 数 字 图 像 处 
理 技术 的 目标 是 使 数字 处 理 对 图 像 的 视觉 效果 影响 最 小 ， 也 就 是 说 ， 希 望 平坦 区 域 以 均匀 一 
致 的 亮度 显示 出 来 。 

假设 显示 亮点 具有 如 下 形式 的 二 维 高 斯 分 布 : 

5 风 S 人 站 三 (4-22) 













































式 中 ，r 是 从 亮点 中 心 量 起 的 径 向 距离 。 如 果 定义 R 为 亮度 等 于 最 大 值 一 半 处 的 半径 ， 则 可 
以 将 点 分 布 曲线 函数 写 为 如 下 形式 ; 
POD=e (4-23) 
上 式 可 以 进一步 简化 为 
IE (4-24) 


因此 ， 亮 度 分 布 如 图 4-14 所 示 。 根 据 以 上 推导 ， 单 个 点 的 亮度 分 布 可 表示 如 下 : 
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图 4-14 高 斯 点 的 高 度 剖 面 


人 (4-25) 

由 于 高 斯 点 只 有 在 离 中 心 大 约 两 倍 以 上 半径 的 距离 时 亮度 才 降 至 不 足 其 峰值 的 1%， 因 
此 除非 显示 点 间距 较 大 才 不 会 发 生 重 伏 ， 距 离 太 小 则 会 发 生 重 登 。 注 意 ， 点 中 心 与 两 点 中 间 
位 置 的 亮度 差 为 12. 5%， 因 此 ， 在 4d = 2R 时 无 法 给 出 微观 平坦 的 区 域 。 

6， 高 频 响 应 

对 于 图 像 显 示 特 性 而 言 ， 高 频 响应 是 指 系统 再 现 直 线 图 案 性 能 的 好 坏 ， 系 统 再 现 直线 图 
案 的 性 能 反映 了 显示 图 像 细 节 的 能 力 。 显 示 一 种 常用 的 高 频 测 试图 案由 相距 一 个 像素 的 明暗 
交替 竖 直 线 构成 ， 有 时 被 称 为 “ 线 对 ”， 其 中 每 一 线 对 包括 一 条 暗 线 〈 由 零 亮 度 像素 组 成 ) 
和 相 邻 的 一 条 亮 线 〈 由 高 亮度 像素 组 成 )。 

如 图 4-15 所 示 ， 在 高 频 竖 线 图 案 中 ， 粗 黑 点 代表 高 亮度 的 像素 ， 小 黑 点 代表 零 亮 度 的 
像素 。 因 此 ， 可 以 得 出 位 于 线 上 的 像素 中 心 的 亮度 为 








D(0.0)~1+2p(d)+2p(2d) (4-26) 
而 线 间 像素 亮度 可 以 用 下 式 表 示 : 
DG0) 一 2p(d)+4P(CV2d) (4-27) 
调制 系数 M 可 用 下 式 表示 ; 
_D0.0-D240) (4-28) 
D(0.0) 
M 与 点 间距 的 关系 如 图 4-16 所 示 。 根 据 该 曲线 ， 当 点 间距 小 于 2R 时 ， 调 制 深度 迅 
速 下 降 。 
100 
90 
了 卜 
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图 4-15 “高 频 坚 线 图 案 的 关键 位 置 图 4-16 ”间距 对 高 频 坚 线 图 案 的 影响 
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显示 点 间距 越 小 ， 均 匀 区 域 的 平坦 性 越 好 ， 而 间距 越 大 ， 则 越 能 更 好 地 再 现 图 像 细 节 及 
其 对 比 度 。 因 此 ， 就 点 间距 的 选择 而 言 ， 区 域 平坦 性 与 高 频 响 应 的 要 求 是 一 对 矛盾 。 实 际 选 


间距 可 认为 是 一 个 在 图 像 处 理 中 必须 适当 调整 的 显示 参数 。 


8 噪声 考虑 
显示 系统 的 电子 噪声 可 能 引起 的 不 利 包括 显示 点 位 置 与 亮度 两 个 方面 。 
(1) 位 置 噪声 


一 种 较 严重 的 影响 来 自 偏转 电路 ， 即 可 能 引起 点 显示 间距 的 不 均匀 。 除 非 极其 严重 ， 否 
则 显示 位 置 噪声 不 会 给 图 像 带 来 视觉 系统 可 观察 到 的 几何 畸变 。 然 而 ， 点 相互 影响 与 位 置 品 
声 的 组 合 会 产生 较 大 的 幅 值 变化 ， 因 为 点 相互 影响 效应 放大 了 位 置 噪声 ， 要 得 到 好 的 显示 特 
性 必须 精确 控制 像素 的 位 置 。 

(2) 幅 值 噪声 

如 果 所 有 噪声 〈 包 括 随机 噪声 和 周期 性 噪声 ) 幅 值 都 低 于 一 个 灰 度 级 ， 那 么 总 的 显示 
效果 较 理想 。 亮 度 通道 的 随机 噪声 会 产生 一 种 “胡椒 加 盐 ”( 即 黑白 噪声 点 ) 的 效果 ， 在 平 
坦 区 域 中 ， 尤 其 明显 。 而 对 于 与 水 平 或 垂直 偏转 信号 相同 的 周期 性 噪声 ， 它 可 能 产生 条 状 


数字 图 像 的 暂时 显示 


最 常见 的 暂时 显示 是 采用 光栅 扫描 的 阴极 射线 管 《CRT) 和 液晶 显示 器 (LCD )。 

对 于 CRT， 其 像素 点 的 亮度 随 着 位 置 的 不 同 而 变化 ， 从 而 产生 图 像 ， 显 示 系统 根据 存储 
的 数字 图 像 数据 ， 周 期 性 地 连续 扫描 和 刷新 显示 点 。 对 于 普通 的 电视 监视 器 若 能 提供 合适 的 
视频 信号 ， 也 可 用 做 数字 图 像 显 示 器 。 

LCD 是 另 一 种 常用 的 显示 设备 ， 它 是 一 种 低 电 压 、 低 功 耗 器 件 ， 可 直接 由 MOS-IC 驱 
动 ， 因 此 器 件 和 驱动 系统 之 间 的 配合 较 好 。LCD 的 优点 是 结构 简单 ， 平 面 型 ， 显 示 面 也 可 任 
意 加 工 ， 而 且 LCD 是 反射 型 的 ， 在 室内 也 很 容易 看 到 数字 图 像 。 目 前 ， 台 式 计算 机 、 便 扒 
式 计算 机 、 手 表 、 玩 具 、 计 算 器 、 民 航 候 机 牌 、 火 车 候车 室 、 户 外 广告 ， 以 及 测量 仪器 和 航 
天 测控 显示 等 都 广泛 使 用 了 液晶 显示 设备 。 


数字 图 像 的 永久 显示 


永久 显示 是 指 将 图 像 永 久 记录 在 纸 或 胶片 等 介质 上 的 过 程 ， 其 中 图 像 记 录 器 、 打 印 机 和 
其 他 图 像 硬 拷贝 设备 是 常用 的 图 像 永 久 显示 设备 。 

1. 抖动 技术 和 彩色 印 制 

(1) 抖动 技术 

拉动 技术 是 弥补 所 用 颜色 不 足 的 一 个 有 效 办 法 ， 即 以 实心 点 图 案 仿 真 灰 度 级 的 处 理 过程 
称 为 抖 动 或 半 影 调 。 拌 动 技术 有 多 种 方式 ， 但 不 论 采 用 什么 方式 ， 所 有 拉动 技术 的 基本 原理 
相同 ， 即 用 直接 显示 其 色彩 的 像素 模式 来 替换 那些 色彩 不 能 直接 显示 的 像素 拉动 技术 利用 
了 生活 中 的 一 个 简单 原理 : 人 的 肉眼 能 将 两 种 不 同 颜色 的 相 邻 像素 融合 成 第 三 种 颜色 。 一 种 
拌 动 方法 可 能 用 一 个 蓝 色 像素 与 黄色 像素 交错 的 模式 去 替换 一 块 绿色 像素 ， 这 种 处 理 方法 称 














让 





为 模式 抖动 。 模 式 抖动 存在 的 问题 是 有 时 成 组 的 非 相关 像素 会 结合 形成 被 称 为 人 工 痕迹 的 子 
模式 ， 它 们 能 影响 最 终 的 图 像 。 抖 动 图 像 的 一 个 更 好 办 法 是 使 用 一 种 叫 扩散 抖动 的 技术 ， 它 
不 依赖 于 事先 设 定 的 颜色 模式 ， 而 是 着 眼 于 图 像 中 的 每 一 个 像素 ， 并 给 它 指定 一 种 尽 可 能 与 
其 原来 颜色 匹配 的 新 颜色 ， 然 后 通过 适当 的 计算 以 量化 新 旧 颜色 之 间 的 差异 ， 并 将 这 种 差异 
扩散 到 其 相 邻 像素 的 颜色 中 。 例 如 ， 如 果 一 个 像素 的 新 颜色 中 所 包含 的 红色 与 绿色 比 旧 颜色 





中 所 包含 的 红色 与 绿色 少 ， 则 扩散 抖动 会 给 周围 的 像素 中 增加 适当 的 红色 与 绿色 。 这 种 对 拌 
动 的 适应 处 理 清除 了 人 工 痕 迹 并 且 通 常 能 产生 更 好 的 效果 。 抖 动 也 能 用 于 为 打印 机 这 类 单 色 
设备 产生 彩色 图 像 的 黑白 再 现 ， 如 半 影 调处 理 过 程 可 用 于 产生 报纸 上 的 黑白 图 片 。 

(2) 彩色 印 制 

人 类 的 视觉 系统 能 独立 地 感觉 红 (Red)， 绿 (Green)， 蓝 〈Blue) 三 个 波段 光 ， 人 眼 能 
识别 的 颜色 均 可 由 红 、 绿 、 蓝 通过 适当 混合 来 实现 ， 因 此 它们 又 称 为 三 基色 。 例 如 ， 彩 色 
CRT 就 是 利用 了 这 个 特性 。 

硬 拷贝 的 视觉 效果 是 通过 反射 光 获 得 的 ， 其 图 像 的 基本 构成 元 素 是 三 种 颜料 ， 分 别 吸收 
红 光 、 绿 光 和 蓝光 。 在 白光 下 ， 吸 收 红 光 的 颜料 呈现 青色 ， 吸 收 绿 光 的 颜料 呈现 品 红色 ， 吸 
收 蓝光 的 颜料 呈现 黄色 。 理 论 上 ， 按 不 同比 例 混合 这 三 种 颜料 可 以 获得 任何 视觉 可 见 的 颜 
色 。 青 色 〈Cyan)、 品 红 〈Magenta)、 黄 色 〈Yellow) 称 为 补 色 ， 被 用 于 彩色 打印 中 的 三 个 
基本 颜色 ， 这 就 是 所 谓 的 CMY 系统 。 

理论 上 ， 若 将 等 量 青 色 、 品 红 和 黄色 的 颜料 混合 ， 由 于 红 、 绿 、 蓝 光 被 它们 分 别 吸 收 
了 ， 因 而 呈现 黑色 ， 混 合 三 种 补 色 而 得 到 的 黑色 被 称 为 合成 黑 。 而 稀释 的 混合 物 ， 由 于 只 能 
吸收 一 部 分 入 射 光 而 呈现 出 灰色 。 实 际 应 用 中 ， 由 于 不 能 产生 合适 的 灰色 影 调 ， 因 此 ， 实 际 
的 彩色 印刷 通常 使 用 第 四 种 墨水 一 一 黑 (Black) 墨水 ， 以 保证 正确 表达 灰 度 信息 ， 这 种 系 
统称 为 CMYK 系统 或 四 色 印 刷 法 。 

2. 永久 记录 设备 

(1) 喷 墨 打印 机 

喷 墨 打印 机 的 输出 图 像 分 辩 率 通常 在 300 一 600dpi 之 间 。 无 论 是 单 色 还 是 彩色 液体 喷 墨 
打印 机 ， 都 是 通过 一 组 微小 喷嘴 〈 安 装 在 可 随意 组 装 的 夹 头 上 ) 喷射 出 墨水 流 ， 由 于 墨水 的 
不 透明 性 ， 因 此 ， 需 要 使 用 抖动 技术 来 产生 不 同 的 灰 度 。 墨 水 喷 到 纸 或 胶片 上 ， 干 爽 后 形成 

-个 个 小 点 ， 必 要 时 可 通过 加 热 来 缩短 干燥 过 程 ， 防 止 墨水 在 干燥 过 程 中 发 生 浸润 。 

使 用 普通 纸 打 印 时 ， 墨 水 干燥 之 前 会 在 纸 上 扩散 ， 使 打印 的 像素 略 有 变 大 ， 使 图 像 变 得 
模糊 。 若 采用 专用 纸 ， 则 可 以 较 好 地 控制 这 种 现象 ， 使 图 像 更 清晰 。 

(2) 激光 打印 机 

激光 打印 机 是 目前 应 用 最 广泛 的 高 质量 打印 机 ， 其 优点 是 打印 质量 高 ， 分 辩 率 高 ， 色 彩 
艳丽 ， 噪 声 低 ， 速 度 快 ， 不 足 之 处 是 价格 较 贵 ， 打 印 成 本 高 ， 不 能 打印 多 层 介 质 。 

激光 打印 机 是 通过 电子 成 像 技 术 进 行 打印 的 ， 当 调制 激光 束 在 硒鼓 上 沿 轴 向 扫描 时 ， 根 
据 字符 信息 的 点 阵 结 构 ， 使 硒鼓 面 感光 ， 形 成 负电 荷 阴影 ， 在 硒鼓 面 经 过 带 正 电荷 的 墨 粉 
时 ， 感 光 部 分 会 吸附 上 黑 粉 ， 并 将 墨 粉 转 印 到 纸 上 ， 纸 上 的 墨 粉 经 加 热 熔化 形成 永久 性 的 字 
符 与 图 像 。 

(3) 图 像 记 录 器 

一 种 常用 的 图 像 记 录 器 是 CRT 胶片 记录 器 。CRT 胶片 记录 器 实质 上 是 一 个 安装 在 CRT 



































显示 器 前 的 照相 机 ， 当 快门 打开 时 ， 整 个 图 像 像素 逐个 显示 以 使 胶片 曝光 。 它 只 需要 显示 一 





饥 ， 无 需 刷 新 。 像 素 亮度 的 调制 有 两 种 方法 ， 可 以 通过 控制 显示 点 的 亮度 来 实现 ， 还 可 以 通 
过 控制 每 个 像素 的 显示 时 间 来 实现 。 胶 片上 像素 点 的 曝光 量 与 曝光 强度 和 曝光 时 间 的 乘积 成 
比例 。 

(4) 静电 绘图 仪 

静电 绘图 仪 是 一 种 利用 静电 同 极 相 斥 、 异 极 相 吸 的 原理 进行 工作 的 光栅 扫描 设备 。 单 色 
静电 绘图 仪 是 把 像素 化 后 的 绘图 数据 输出 至 静电 写 头 上 ， 静 电 写 头 一 般 是 双 行 排列 ， 写 头 内 
装 有 许多 电极 针 。 写 头 根据 输入 信号 控制 每 根 电极 针 所 放出 的 高 电压 ， 绘 图 纸 正 好 横 跨 在 写 
头 与 背 板 电极 之 间 ， 纸 张 通过 写 头 时 ， 写 头 便 将 图 像 信 号 转换 到 纸 上 。 带 电 的 绘图 纸 经 过 黑 
水 糟 时 ， 由 于 墨水 的 碳 微粒 带 正 电 ， 所 以 墨水 被 纸 上 的 电子 吸附 ， 从 而 形成 图 像 。 彩 色 静 电 
与 单 色 静电 绘图 仪 的 原理 类 似 ， 根 据 CMYK 系统 的 颜色 合成 理论 ， 当 进行 彩 
色 绘 图 时 ， 纸 张 往返 运动 ， 分 别 套 上 品 红 、 黄 、 青 、 黑 四 种 颜色 ， 根 据 比 例 可 形成 各 种 所 需 
要 的 彩色 。 








彩色 静电 绘图 仪 的 分 辨 率 可 达 800dpi 或 更 高 ， 若 选用 高 质量 的 墨水 和 纸张 ， 则 
所 产生 的 彩色 图 片 比 彩色 照片 的 质量 更 好 。 

(5) 热量 转移 打印 机 

热 螨 转 移 打印 机 使 用 塑料 胶片 ， 塑 料 胶片 上 的 涂 层 是 浸 过 颜料 的 蜡 。 这 种 色 带 带 有 矩形 
的 面板 ， 每 个 面板 与 打印 样张 大 小 相同 ， 并 涂 以 墨水 。 面 板 上 的 颜色 有 青色 、 品 红 、 黄 色 和 
黑色 。 与 喷 墨 打印 机 的 原理 类 似 ， 热 螨 转移 打印 机 也 需要 采用 拌 动 技术 形成 彩色 影 调 。 工 作 
时 ， 每 次 选用 CMYK 颜色 系统 中 的 一 种 颜色 ， 具 体 方法 即将 相应 的 色 带 面板 与 打印 介质 接 
触 并 由 打印 头 进行 绘制 。 打 印 头 上 有 成 千 上 万 的 微小 加 热 元 件 ， 可 以 按 控 制 信息 通电 使 蜡 熔 
化 并 转移 到 纸 上 产 生 一 个 点 ， 打 印 分 辨 率 可 达 300dpi 以 上 。 


4.6 ”二 维系 统 及 矩阵 运算 


对 于 数字 图 像 处 理 技术 而 言 ， 二 维 线性 系统 具有 重要 的 意义 和 广泛 的 应 用 ， 同 时 也 是 学 
习 其 他 章节 的 基础 。 


和 二 维 线性 系统 


设 /xy) 是 二 维系 统 的 给 定 输入 ，8;(x,y) 表示 其 输出 ， 即 
go0D)=TLAGCcD] =12… (4-29) 
若 该 系统 的 输入 、 输 出 满足 以 下 特性 : 
agoD)+ga)=a7[CNGCc+ew7[CAOcD] 
=T[oj0o 人 +oPCcD] (4-30) 





则 称 该 系统 为 二 维 线性 系统 。 


ES 二 维 位 置 不 变 线性 系统 | 


对 于 任意 一 个 二 维系 统 ， 若 给 定 输入 F(x,y) ， 则 产生 输出 g(x) ， 即 


训 





8gGCco)=TLACcy] (4-31) 
将 输入 信号 自 变 量 x 和 ?分别 平 移 m 和 ， 若 满足 以 下 条 件 : 


SG 一 区 -为 )=TLAGz 一 ao 一 攻 )] (4-32) 
即 输出 信号 的 函数 形式 不 变 ， 仅 仅 是 输出 信号 的 自 变 量 分 别 平移 同样 长 度 冲 和 为 ， 则 
二 维系 统 具 有 移 不 变 特性 ， 或 称 为 二 维 移 不 变 系统 ， 又 称 为 二 维 位 置 不 变 系统 。 若 二 维系 统 
既 满足 线性 特性 ， 又 满足 位 置 移 不 变 特性 ， 则 称 为 二 维 位 置 不 变 线性 系统 〈 也 可 称 为 空间 不 
变 线性 系统 )。 
- 维 位 置 不 变 线性 系统 的 输出 也 可 以 通过 输入 信号 与 其 冲 激 响应 函数 zx,y) 的 二 维 卷 积 
求 出 。 对 于 二 维 连续 系统 ， 其 形式 如 下 : 
8CcD)= Co)hGcD) 
= 站 三 renec-wy-wdudy (4-33) 
对 于 二 维 离散 系统 ， 其 形式 如 下 : 
g(]=》》 JomnmDAnGi-m7 几 (4-34) 


二 维系 统 的 梯度 算 子 | 


数字 图 像 处 理 及 分 析 中 ， 无 论 是 图 像 的 增强 处 理 、 图 像 的 复原 ， 还 是 边缘 检测 ， 许 多 处 
理 方法 需要 应 用 二 维系 统 的 梯度 算 子 ， 梯 度 是 图 像 处 理 算法 中 的 一 个 重要 概念 。 

1. 连续 系统 梯度 算 子 

对 于 连续 系统 ， 在 坐标 位 置 (x,y) 处 的 梯度 向 量 为 


这 Jet7 训 /Go (4-35) 
上 式 也 可 写 为 
人 人 (4-36) 
ap 
由 于 梯度 是 向 量 ， 因 此 其 幅 值 为 
的 天 必 | (4-37) 
Ex 引 
梯度 的 方向 为 
-aan( 这 引 (4-38) 


2 离散 系统 梯度 算 子 
在 数字 图 像 处 理 中 ， 包 括 常用 的 罗伯特 算 子 、 索 贝尔 算 子 、 普 瑞 维特 算 子 等 在 内 的 各 种 梯 

度 算 子 均 以 差分 形式 表示 。 因 此 ， 差 分 梯度 算 子 在 图 像 处 理 中 具有 广泛 的 应 用 领域 。 由 于 无 论 
是 方向 还 是 ?方向 ， 离 散 系统 坐标 值 的 最 小 增 量 为 1， 因 而 以 相 邻 点 之 差 近似 表示 梯度 分 量 ; 
人 

AA= (mw 站 -Con-D 














〈4-39) 





梯度 的 幅 值 为 


V=WJQA- + 


(4-40) 


在 某 些 情况 下 ， 为 简单 起 见 〈 避 免 平方 根 运 算 )， 可 以 根据 具体 情况 分 别 采用 如 下 方法 


计 梯 度 的 近似 值 ; 
W 一 maxdAs 几 |, 由 
显然 ， 离 和 散 系 统 梯度 的 幅 值 与 上 述 两 种 近似 值 之 间 存 在 以 下 关系 ; 


maxdAxj|A, 几 < JAD + slAsyl+|A 
和 常用 矩阵 运算 


1. 和 珑 阵 的 转 置 与 共 罗 
设 4 表 示 MxN 托 阵 ， 矩 阵 4 表示 如 下 : 


本 中 有 5 av 
[nn 
4=| al aa GaN 
LE 2 


式 (4-43) 简单 表示 为 4= {oy} 。 
式 中 ，a(7) 表示 矩阵 4 的 第 ; 行 第 7 列 元 素 。; 与 7 的 取 值 分 别 如 下 ， 


i=12,3……Mf 
记 23N 
则 和 矩阵 4 的 转 置 矩阵 如 下 : 
al 0 ai 
aa aa … anw2 
人 = 
抽 
式 中 ,，; 与 7 的 取 值 范围 不 变 。 
和 矩阵 4 的 共 斩 矩 阵 如 下 ; 
al an av 
Ga av 
式 =| 国人 Biw 
an aa … ou 
即 


才 = 人 0 12237523…N 
同 理 ， 可 以 得 出 其 共 辆 转 置 矩阵 为 


0 


(4-42) 


(4-43) 


(4-44) 


《4-45) 


和 水 








(4 = (ai 1=123 Mi7=12.3…,N (4-46) 
2. 和 矩阵 的 行列 式 与 逆 矩 阵 


虽然 矩阵 与 行列 式 在 形式 上 类 似 ， 它 们 都 是 以 矩形 陈列 ， 但 却 是 两 个 不 同 的 概念 。 行 列 


式 是 一 个 数 ， 而 是 指 按 一 定 的 运算 规律 所 确定 的 一 个 数 ， 它 要 求 行 数 与 列 数 必须 相同 。 和 矩阵 
不 是 一 个 数 ， 而 是 按 一 定 方式 排列 的 一 张 有 序 的 数值 表 ， 其 行 数 与 列 数 可 以 不 同 。 当 称 阵 的 
行 数 与 列 数 相 同时 ， 则 称 其 为 方 阵 ， 由 阶 方 阵 4 的 元 素 构成 的 阶 行列 式 ， 称 为 方 阵 4 
的 行列 式 ， 记 为 |4 引 ,或 det 4 。 





如 果 方 阵 4 的 行列 式 | 媳 *0 ， 则 称 4 可逆， 其 逆 和 矩阵 4 满足 下 式 : 
44=44=7 

于 阶 方 阵 具 有 以 下 主要 性 质 : 

D |4j=| 如 | 

2) |ec 引 =c"|4 


3) |48|=|B4|=|4 和 可 

4) (4B) = 再 4 

5) | 和 = 

6) (47)=( 4 并 

如 果 4 是 一 个 MxN 拢 阵 ， 且 (474) 存 在 ， 则 它 的 伪 逆 用 4 表示， 计算 形式 如 下 : 
0 (4-47) 





并 且 下 式 成 立 ; 
44=T 
3. 正 交 矩 阵 和 酉 矩阵 
正 交 矩阵 和 西 矩阵 都 是 数字 图 像 处 理 运 算 中 经 常 应 用 的 概念 。 
(1) 正 交 和 矩阵 





如 果 和 矩阵 4 满足 : 
天 (4-48) 
则 称 和 矩阵 4 为 正 交 矩阵 。 
(2) 本 矩阵 
对 于 复数 和 矩阵， 如 果 和 矩阵 4 满足 : 
(大 (4-49) 
则 称 和 矩阵 4 为 酉 矩阵 。 
4 和 矩阵 的 迹 
设 1 为 一 个 数 ， 对 于 咽 阶 方 阵 4， 如 果 存在 对 维 的 非 零 列 向 量 v， 使 下 式 成 立 
4v= 和 (4-50) 
则 称 4 为 方 阵 4 的 特征 值 ，v 为 方 阵 4 对 应 于 特征 值 和 的 特征 向 量 。 
方 阵 4 的 特征 值 4 可 以 通过 求解 代数 方程 求解 : 
|4-4|=0 (4-51) 
严 阶 方 阵 4 共有 交 个 特征 值 ， 且 不 同 的 特征 值 所 对 应 的 特征 向 量 线性 无 关 。 





于 阶 方 阵 4 主 对 角 线 上 的 呈 个 元 素 之 和 称 为 方 阵 4 的 迹 ， 用 tr(4) 表示 方 阵 的 迹 ， 即 


t(D= > mw (4-52) 
所 


方 阵 的 迹 具有 以 下 性 质 : 

1) tr(4+ 妈 )=tr(4)+tr(B) 

2) tr(c4) =ctrC4) 

3) tr(4B)=tr(B4) 

4) 若 1, 生 ,为 为 方 阵 4 的 半 个 特征 值 ， 则 有 
tr(4) = 人 + 万 + 十 轧 

史 鸭 = 2 


4.7 ”图像 的 块 操作 


在 MATILAB 7.0 图 像 处 理 中 ， 有 时 并 不 需要 对 整个 图 像 进行 操作 ， 而 是 对 图 像 中 的 某 一 
部 分 〈 即 块 ) 进行 操作 。 例 如 ， 许 多 线性 滤波 操作 和 二 进 制图 像 操 作 均 按照 块 操作 方式 实 
现 。MATLAB 7.0 的 图 像 处 理工 具 箱 提供 了 多 个 专门 用 于 图 像 块 操作 的 函数 ， 如 dilateO) 函 数 
等 。 此 外 ， 工 具 箱 提供 的 大 量 普通 函数 也 适用 于 块 操作 。 利 用 这 些 函数 ， 用 户 可 以 进行 各 种 
块 操作 ， 包 括 边缘 操作 和 显示 块 操作 等 。 


ED zs | 

边缘 操作 属于 块 操作 ， 一 次 只 处 理 一 个 图 像 像素 。 在 MATLAB 7.0 中 ， 像 素 的 边缘 是 - 
个 像素 集 ， 由 该 像素 〈 通 常 称 为 中 心 像素 ) 的 相关 位 置 确定 。 从 本 质 上 讲 ， 像 素 的 边缘 就 是 
由 像素 集 构成 的 一 个 矩形 块 。 当 操作 从 图 像 矩 阵 的 一 个 元 素 移动 到 另 一 个 元 素 时 ， 该 矩形 块 
也 以 相向 的 方向 同时 移动 ， 如 图 4-17 所 示 。 

















图 4-17 边缘 的 移动 


图 4-17 中 的 边缘 为 一 个 2x3 的 矩形 块 ， 黑 点 表示 边缘 的 中 心 像素 。 通 常 ， 对 于 mxn 的 
边缘 来 说 ， 中 心 像素 的 计算 方法 如 下 : 


floorC[Cm+ln+lD)]2) 


例如 ， 图 4-17 中 边缘 的 中 心 像素 为 (1,2)， 即 边缘 块 中 的 第 一 行 第 二 列 对 应 的 元 素 。 











MATLAB 7.0 进行 边缘 操作 的 过 程 如 下 : 
1) 选择 像素 






2) 确 》 的 边缘 块 。 
3) 调用 ii 函数 对 边缘 中 的 元 素 进行 操作 。 
4) 查找 对 应 于 输出 图 像 中 心 像素 的 像素 点 。 
5) 对 于 输入 图 像 中 的 每 个 像素 点 ， 重 复 1) 一 4) 的 操作 。 
以 下 程序 代码 示例 即 调用 nlfilter(0) 函 数 进 行 边缘 操作 的 过 程 ， 其 操作 效果 如 图 
B=imread('tire.tif); 
g=inline(max(x())7; 
B2=nlfilter(B,[3 3].g); 
figure,imshow(B); 
figure,imshow(B2) 





图 4-18 边缘 操作 前 、 后 的 效果 比较 


al 原始 图 像 b) 边缘 操作 后 的 图 像 


4-18 所 示 。 


MATLAB 7.0 中 的 显示 块 是 将 矩阵 划分 为 mxz 后 得 到 的 矩形 部 分 ， 如 图 4-19 所 示 。 








图 4-19 显示 块 


图 中 的 虚 灰 色 方 格 为 数据 矩阵 ，T 的 矩形 则 为 显示 块 。 

MATILAB 7.0 进行 显示 块 操作 的 函数 为 blkprocO) 函 数 ， 该 函数 能 够 将 每 个 号 
中 提取 出 来 ， 然 后 将 其 作 
函数 还 可 以 对 由 用 户 函 数 返 回 的 显示 块 进行 组 合 ， 从 而 生成 最 后 的 输出 图 像 。 














示 块 从 图 像 


戎 数 传递 给 任何 用 户 函 数 〈 即 用 户 指定 的 函数 )。 此 外 ，bklprocO) 


图 像 处 理 的 相关 操作 





以 下 命令 行 利用 4x6 的 显示 块 处 理 矩 阵 7 ， 其 中 用 户 函 数 为 myfun0)。 


B2=blkproc(B,[4 6].myfun; 
另外 ， 还 可 以 把 用 户 函 数 指定 为 一 个 嵌入 式 函 数 〈 即 inlineO) 函 数 )。 在 这 种 情况 下 ， 出 人 
现在 blkprocO 函 数 中 的 嵌入 式 函 数 不 能 带 有 任何 引用 标记 ， 程 序 代 码 如 下 : 
gr=inline('mean2(x)*ones(Size(x)) ); 


B2=blkproc(B,[4 6],g); 


以 下 程序 代码 示例 利用 blkproc(0) 函 数 ， 将 图 像 tire.tif 数据 矩阵 中 的 每 个 8x8 显示 块 中 的 
个 像素 值 设置 为 该 显示 块 中 的 平均 值 ， 操 作 效 果 如 图 4-20 所 示 。 





B=imread(tire tif); 
line(uint8(round(mean2(x)*ones(size(x))7)7; 
B2=blkproc(B,[8 8],e); 

figure,imshow(B); 






figure,imshow(B2) 








图 4-20 显示 志 、 后 的 效果 比较 


a) 操作 前 b) 操作 后 


最 后 需要 说 明 的 是 ， 在 调用 blkprocO 函 数 定义 显示 块 时 ， 可 以 将 其 指定 为 彼此 交 有 登 的 显 
示 块 ， 如 图 4-21 所 示 。 定 义 交 礁 显 示 块 的 程序 代码 如 下 : 





B=blkproc(A ,[48] ,[1 23] ,@myfun) 























图 4-21 彼此 交 登 的 显示 块 








古 MATLAB xs 全 外 是 





如 果 将 图 4-20a 所 示 图 像 中 的 显示 块 定义 为 具有 4x4 的 交 和 登 显示 块 ， 则 处 理 效 果 如 
图 4-22 所 示 


B=imread(tire if; 
-inline(uint8(round(mean2(x)*ones(size(x))))7; 
B2=blkproc(B,[8 8].[4 4].g); 

figure,imshow(B); 

figureimshow(B2) 





图 4-22 ”显示 块 交 故 前 、 后 的 显示 效果 


al 交 三 前 b) 交 垄 后 


4.8 特定 区 域 处 理 








在 进行 图 像 处 理 时 ， 有 时 只 需 对 图 像 中 的 某 个 特定 区 域 进行 处 理 ， 并 不 需要 对 整个 图 像 
进行 处 理 ， 如 要 对 用 户 选 定 的 一 个 区 域 进行 均值 滤波 或 对 比 度 增 强 。MATLAB 7.0 图 像 处 理 
工具 箱 提供 的 某 些 处 理 函 数 可 以 对 指定 的 区 域 进行 处 理 。 

对 特定 区 域 的 处 理 通过 二 值 掩 模 来 实现 。 当 用 户 选 定 一 个 区 域 后 ， 会 生成 一 个 与 原 图 像 
大 小 相同 的 二 值 图 像 ， 选 定 的 区 域 为 白色 ， 其 余部 分 为 黑色 ， 这 样 就 可 以 实现 对 特定 区 域 的 
选择 性 处 理 了 

MATLAB 7.0 图 像 处 理工 具 箱 提供 了 4 个 函数 分 别 支持 对 特定 区 域 的 选择 、 滤 波 和 填充 

roipoly(0) 函 数 用 于 选择 图 像 中 的 多 边 形 区 域 ， 其 调用 格式 参考 MATLAB 7.0 图 像 处 理 了 
具 箱 

以 下 程序 代码 说 明了 roipoly0 函 数 的 用 法 ， 并 根据 指出 的 坐标 选择 一 个 六 边 形 区 域 ， 其 
处 理 效果 如 图 4-23 所 示 。 

















B=imread(eighttif7; 

g=[222 272 300 270 221 194]; 
他 [21 21 75 121 121 75]; 
BW=roipoly(B,g,D; 








figure,imshow(B); 
figure,imshow(BW) 


名 








图 4-23 






的 坐标 选择 六 边 形 


像 b) 选择 后 的 图 像 





国 到 #e 
MATLAB 7.0 图 像 处 理工 具 箱 中 提供 了 roifilt20) 函 数 用 于 对 一 个 区 
参考 MATLAB 7.0 图 像 处 理工 具 箱 。 
以 下 程序 代码 示例 说 明了 roifilt20 函 数 的 用 法 ， 对 特定 区 域 进行 锐 化 
图 4-24 所 示 。 








其 调用 格式 





， 处 理 结果 如 


图 4-24 ”对 特定 区 域 进行 滤波 让 
下 原始 图 像 b) 滤波 后 的 图 像 





B=imread(eighttif); 
&-[222 272 300 270 
仁 [21 21 75 121 121 
BW=roipoly(B,g,D; 
h=fSpecialunsharpy); 
j=roifil2(h.B,.BW): 

figure,imshow(B); 








figure,imshow) 


主 或 人 二 








MATLAEE 











MATLAB 7.0 图 像 处 理工 具 箱 中 提供 了 roifill0 函 数 用 于 对 待定 区 域 进行 填充 操作 ， 其 调 
用 格式 可 参考 MATLAB 7.0 图 像 处 理工 具 箱 。 

以 下 程序 代码 示例 说 明了 roifiltiO 函 数 的 用 法 ， 并 对 特定 区 域 进行 填充 操作 ， 处 理 结果 
如 图 4-25 所 示 。 





B=imread(eighttif); 

g-[222 272 300 270 221 194]; 
他 21 21 75 121 121 75]; 
jeoifill(B,g.9; 
figureiimshow(B); 
figure,imshow() 


引 b) 


图 4-25 对 特定 区 域 进行 填充 的 结果 


a 原始 图 像 b) 填充 后 的 图 像 


4.9 图 像 质量 评价 


绝 大 多 数 情况 下 ， 图 像 处 理 的 目的 是 为 了 改善 图 像 的 《视觉 )》 质量 ， 因 此 ， 如 何 评价 图 
像 的 质量 是 一 个 十 分 重要 的 问题 。 例 如 ， 图 像 增强 的 处 理 目的 是 以 各 种 可 能 的 形式 突出 图 像 
中 用 户 感 兴趣 的 区 域 ， 抵 制图 像 中 的 随机 噪声 ， 提 高 图 像 的 视觉 质量 。 图 像 复原 的 处 理 目的 
是 建立 图 像 质 量 退 化 的 数学 模型 ， 对 图 像 质量 退化 进行 相应 的 补偿 ， 包 括 运动 模糊 补偿 、 焦 
距 模糊 补偿 以 及 噪声 消除 等 。 图 像 编码 压缩 的 目的 则 是 在 尽 可 能 保持 图 像 质量 无损 或 有 损 
压缩 ) 的 条 件 下 ， 对 图 像 数据 进行 编码 压缩 以 减少 数据 存储 量 和 传输 量 。 这 些 处 理 都 涉及 到 
图 像 质量 评 价 问题 。 

由 于 人 类 视觉 及 其 系统 的 高 度 复杂 性 ， 图 像 质量 评价 事实 上 一 直 是 一 个 十 分 困难 的 问 
题 ， 可 以 说 迄今 为 止 ， 还 没有 一 种 权威 、 系 统 并 得 到 公认 的 、 一 应 俱全 的 体系 和 评价 方法 。 
目前 ， 常 见 的 图 像 质量 评价 方法 分 为 客观 评价 和 主观 评价 两 种 。 























图 像 质 量 的 客观 评价 是 指 提出 某 个 或 某 些 定量 参数 和 指标 来 描述 图 像 质量 。 例 如 ， 在 图 
像 压缩 时 ， 评 价 图 像 质 量 的 定量 参数 可 以 选用 解压 图 像 对 基准 图 的 误差 参数 ， 如 常见 的 定量 
参数 是 方 均 误差 MSE 和 峰值 信 噪 比 PSNR。 


1 2 也 
MSE = TY 过 ( (Co7)-7Cc) (4-53) 
PSNR-10xigCam 一 Jo (4-54) 
MSE 


式 中 ，M、N 分 别 对 应 图 像 的 列 数 和 行 数 ， (xy) 、 大 (xc 妇 分 别 为 原始 图 像 和 解压 重建 的 
图 像 ， 太 。、 an 分 别 对 应 图 像 亦 度 的 最 大 值 和 最 小 值 (通常 取 255 和 0)。 

图 像 质量 的 客观 评价 的 另 一 种 方法 是 采用 测试 卡 。 在 测定 电视 的 显示 质量 、 数 码 相机 和 
扫描 仪 的 成 像 质量 时 ， 常 用 不 同 的 标准 测试 卡 来 完成 ， 如 在 测定 数码 相机 的 分 辩 率 时 ， 通 常 
用 专业 的 标准 分 辨 率 测试 卡 〈 见 图 4-26) 进行 照相 ， 然 后 利用 配套 软件 对 标准 测试 卡 图 像 进 
行 观察 和 计算 ， 可 以 测 出 数码 相机 的 分 辨 率 〈 线 














图 4-26 1SO 12233 标准 分 辨 率 测试 卡 
0 和 定 


人 和 全 着 cs 2 但 










图 像 质 量 的 主观 评价 是 指 采 用 目 视 观 察 和 主观 感觉 评价 图 像 的 质量 。 

主观 评价 的 方法 类 似 和 抽 人 由 数 名 裁判 组 成 评分 小 组 ， 根 据 规 则 要 求 和 评 
分 标准 对 体操 的 比赛 动作 进行 打分 ， 评 分 结果 取 总 和 或 平均 值 。 有 些 比 赛 还 采取 去 掉 
最 高 分 和 最 低 分 的 方法 ， 以 减少 带 有 倾向 让 分 的 影响 。 

图 像 质 量 主观 评价 的 “裁判 ”可 以 由 未 经 训练 的 普通 观察 者 来 担任 ， 
员 和 图 像 专家 来 担任 。 也 可 由 未 经 训练 的 普通 观察 者 和 专业 图 像 尖 
专家 组 ) 进行 评价 。 评 价 时 需要 事先 制定 评分 标准 以 及 评分 规 风 









或 由 专业 图 像 判 读 
分 组 〈 普 通 观 察 者 和 
然后 依据 标准 和 规则 进行 






训 





分 组 评价 ， 世 界 各 主要 国家 和 组 
图 像 质量 主 观 评价 的 特点 是 主观 性 和 定性 评 ， 评 价 结果 受 人 为 影响 和 干扰 较 多 ， 但 由 于 
目前 的 图 像 质 量 客观 评价 的 指标 和 参数 尚 不 能 完全 反映 主观 视觉 对 图 像 质量 的 评价 ， 所 以 图 


像 质量 主观 评价 还 是 最 重要 的 


织 


织 


价 方法 之 一 。 


对 图 像 质量 主观 评价 的 评分 标准 见 表 4-1。 


表 4-1 世界 各 主要 国家 和 组 织 对 图 像 质 量 主观 评价 的 评分 标准 


























质 比 
每 级 的 主观 质量 | 国家 和 组 织 比较 的 衡量 国家 和 组 织 
五 | 5 优 42 好 得 多 
表 | 4 良 原 联 邦 德 41 好 二 二 
可 | 训 中 国 、 日 本 、 0 相同 全 和 因 
2 次 英国 1 坏 gov 
1 劣 -2 坏 得 多 
43 好 得 多 
吕 民 世 好 
级 | 4 中 时 汉 人 欧洲 国际 广 
标 | 3 稍 次 播 联盟 等 
盟 等 1 稍 坏 
准 | 2 次 拓 
2 3 坏 得 多 














日 常生 活 中 观察 到 的 数字 图 像 成 像 系 统 及 其 成 像 原理 。 
性 系统 ? 线性 系统 具有 哪些 重要 性 质 ? 
试 写 出 调谐 信号 的 函数 形式 。 
试 写 出 传递 函数 的 数学 表达 式 ， 传 递 函 数 具 有 哪些 重要 性 质 ? 
若 某 系统 为 线性 移 不 变 系 统 ， 在 传递 函数 的 作用 下 ， 当 输入 信号 频率 为 5 的 调谐 
信号 时 ， 系 统 的 输出 信号 的 频率 是 多 少 ? 为 什么 ? 

4-7 试 简 述 什么 是 抖动 技术 。 

4-8 方 阵 具 有 哪些 性 质 ? 
迄今 为 止 为 什么 还 用 图 像 质 量 主观 评价 标准 ? 它 有 何 意义 ? 








第 5 章 图 像 频 域 变换 


在 MAILAB 中 ， 一 般 用 二 元 函数 /Kx,y) 作为 图 像 的 数学 表示 。 (xy) 表示 在 特定 点 


人, 妇 处 的 函数 值 ， 表 示 图 像 在 该 点 相应 的 颜色 强度 或 者 灰 度 。 所 谓 图 像 变 换 就 是 指 把 图 像 
转换 为 另 一 种 数学 表示 方法 的 操作 。 

在 图 像 处 理 技术 中 ， 图 像 的 正 交 点 变换 技术 有 着 广泛 的 应 用 ， 是 图 像 处 理 的 重要 工具 。 
通过 图 像 变换 ， 改 变 图 像 的 表示 域 及 表示 数据 ， 可 以 给 后 续 工 作 带 来 极 大 的 方便 。 例 如 ， 傅 
里 叶 变 换 可 使 处 理 分 析 在 频 域 中 进行 ， 使 运算 变 得 简单 ， 而 离散 余弦 变换 (DCT) 可 使 能 量 
集中 在 少数 数据 上 ， 从 而 实现 数据 压缩 ， 便 于 图 像 传 输 和 存储 。 

在 MATLAB 7.0 图 像 处 理工 具 箱 中 ， 提 供 了 几 种 常用 的 图 像 变换 函数 ， 它 们 是 傅 里 叶 变 
换 (Fourier Transform)， 离 散 余弦 变换 〔Discrete Cosine Transform) 和 Radon 变换 (Radon 
Transform)。 另 外 ， 随 着 小 波 分 析 方法 在 图 像 处 理 中 的 应 用 不 断 发 展 成 熟 ，MATLAB 小 波 分 
析 工 具 箱 也 提供 了 很 多 小 波 变换 函数 ， 用 于 图 像 处 理 。 鉴 于 篇 幅 限 制 ， 关 于 小 波 分 析 在 图 像 
处 理 中 的 应 用 在 这 只 用 一 小 节 讲 述 ， 在 第 9 章 会 展开 来 讲述 。 


5.1 傅 里 叶 变换 


假设 /omw,m) 是 一 个 包含 两 个 离散 空间 变量 阁 和 的 函数 ， 则 该 函数 的 二 维 傅 里 叶 变换 
的 定义 如 下 : 





Fw,o)= 六 六 /onmeiorion (5-1) 


式 中 ， 和 o 为 频 域 变量 ， 其 单位 为 弧度 /采样 单元 。 通 常 函数 F(awl ,wz) 称 为 函数 /mm 
的 频 域 表示 。 F(w,w) 是 复 变 函数 ， 其 变量 w 和 的 周期 均 为 2f 。 因 为 这 种 周期 性 的 存 
在 ， 所 以 通常 在 图 像 显 示 时 ， 这 两 个 变量 的 取 值 范围 为 -r 和 wo 冬 元 。 

傅 里 叶 反 变 换 的 定义 如 下 ; 

7oom= 挛 必 必 Fo,w)eianeiondaldan (5-2) 

简单 地 说 ， 该 方程 说 明 /mw,m) 可 以 表示 为 无 限 多 项 式 不 同 频 率 的 复 指 函数 之 和 。 而 不 
同 的 频率 点 (w,wz) 所 占 的 比例 由 幅度 F(aw,o;) 决定 。 

例如 ， 考 察 下 面 的 矩形 函数 /mw,m]) ， 该 函数 在 一 个 矩形 区 域 中 的 函数 值 为 1， 在 其 他 区 
域 中 的 函数 值 都 为 0， 如 图 5-1a 所 示 。 

在 MAILAB 7.0 中 ， 变 量 六 、 和 函数 f(w,m) 均 采 用 离散 形式 表示 ， 所 以 要 想 真 实地 逼 
近 连 续 函 数 ， 只 能 通过 提高 取样 率 来 实现 。 因 此 ， xz, 站 函数 的 传 里 叶 变换 可 由 以 下 程序 














段 获得 ， 傅 里 叶 变 换 的 
和 垂直 分 量 





直 即 |P(w ,os)|， 如 图 5-lb 所 示 。 其 中 x 轴 和 >》 轴 分 别 为 水 平分 量 


clear 

N=100 

仁 zeros(50,50); 
f15:35,23:28)=1 
figure,imshow(f'motruesize7; 
上 = 亿 2| 、N); 

F2= 人 shift(abs(F)); 

figure; 

x=1Niy=1N; 
mesh(x,y,F2(xy)); 





colormap(grayj;colorbar 





执行 程序 代码 后 效果 如 图 5-1 所 示 





图 5-1 矩形 连续 函数 及 其 傅 里 叶 变换 的 幅 值 


划 矩形 连 





函数 “b) 传 里 叶 变 换 








对 于 传 里 叶 变换 的 结果 ， 通 另 一 种 方法 进行 显示 ， 即 将 变换 结果 的 函数 值 取 对 数 ， 
即 log|F(w,oo)| (在 MATLAB 中 ，log|F(wos]| 即 为 mn|F(w,w 站 ， 但 习惯 用 log|F(w,w)| ) 

















接近 于 0 值 部 分 的 细节 凸 现 出 来 ， 如 图 5-2 所 示 
clear 
N=100 
仁 zeros(50,50); 
信 15: 28)==1; 


figure,imshow(f'notruesize); 
F= 人 2(CN.N); 
F2=log(abs(F)); 

figure; 

x=LNy=1N; 


imshow(F2,[],notruesize7 


98>| 
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图 5-2 传 里 叶 





对 数 图 形 


al 矩形 连续 函数 b) 传 里 叶 变换 对 数 图 形 


对 如 图 5-1 所 示 的 矩阵 连续 函数 旋转 一 个 角度 ， 可 得 到 如 图 5-3a 所 示 的 图 像 ， 然 后 对 
其 进行 傅 里 叶 变 换 ， 得 到 如 图 5-3b 所 示 的 对 数 图 





划 





数 及 其 傅 里 叶 变换 的 对 数 图 


al) 旋转 后 的 矩形 函数 b) 傅 里 叶 变换 的 对 数 图 


clear 

N=100 

全 zeros(50.50); 

女 28)=1; 





三 imrotate(f45vbilinear) % 图 像 旋 转 4$” (5.2 节 讲述 ) 
figure,imshow(J,notruesize) 

FE= 租 2(JNN); 

F2=log(abs(F)); 

figure; 

x=1N:y=1N 





imshow(F2,[],notruesize) 





比较 2 和 图 $-3， 可 以 发 现 二 维 傅 里 时 变换 具有 如 下 旋转 性 质 : 
如 果 在 极 坐标 下 表示 二 维 函 数 图 形 ， 把 空间 域 和 空间 频 域 的 直角 坐标 均 作 坐标 转换 。 


二 99 














空间 域 x=rcosg,y=rsing 空间 频 域 。 x=wcos 办 = wsin 力 
则 有 FU,z) 在 空间 域 极 坐标 系 中 表示 为 fo,2) ，FGwv) 在 空间 频 域 极 坐标 系 中 表示 为 
F(o,g) 。 如 果 有 


Jr,6) 近 Fo 内 (5-3) 

则 有 
JrO+Bb)e 人 Fo.H+ 肉 ) (5-4) 
即 如 果 jcy) 在 空间 旋转 一 个 角度 b% 后 得 到 新 的 函数 ftr,9+6)， 其 对 应 的 傅 里 叶 变换 
F(o,g+ 贝 ) 是 7(cy) 的 傅 里 叶 变 换 Fo,g) 在 空间 频 域 中 旋转 同样 的 角度 鸟 得 到 的 函数 ， 反 


BB 离散 傅 里 叶 变换 | 


在 用 计算 处 理 傅 里 叶 变 换 通常 采用 离散 傅 里 叶 变 换 〈Diserete Fourier Transform ， 
DFT)。 采 用 离散 傅 里 叶 变换 主要 有 以 下 两 个 原因 : 

1) 因为 DFT 的 输入 /输出 均 为 离散 值 ， 非 常 适用 于 计算 机 的 操作 运算 。 

2) 采用 离散 傅 里 叶 变 换 ， 就 可 以 用 一 种 快速 算法 ， 即 快速 傅 里 叶 变换 〈Fast Fourier 
Transform，FFT)。 

FFT 的 设计 思想 是 将 原 函 数 分 为 奇数 项 和 偶数 项 ， 通 过 不 断 将 一 个 奇数 项 和 一 个 偶数 项 
相 加 〔〈 减 )， 得 到 需要 的 结果 。 

也 就 是 说 FFT 是 将 复杂 的 乘法 运算 变 成 两 个 数 相 加 《〈 减 ) 的 简单 运算 的 重复 ， 即 通过 
计算 两 个 单 点 的 DFT， 来 计算 一 个 双 点 的 DFT， 通过 计算 两 个 双 点 的 DFT， 来 计算 四 个 点 
的 DFT…… 依 此 类 推 。 

对 于 任何 N = 2” 的 DFT 计算 ， 通 过 计算 两 个 NW12 点 的 DFT， 来 计算 N 个 点 的 DFT。 

设 离散 函数 fmw, 站 在 有 限 区 域 (0<m<sM-1，0<n 和 N-1) 非 零 。 则 快速 传 里 叶 变 
换 的 主要 推导 过 程 如 下 : 


令 
"=expCj2m 邮 ) 65-5) 
则 有 
1 
FUD)= 二 之 JOY 
NS 
1 2 Na 2 iD) 
- 准 ee 二 包 JJC2m+DBNE ] 
中 工 如 人 apmj 了 忆 
全 天 包 JCmHN 2 TV (5-6) 
1 
= 了 [CD)+ 璨 瓦 (D] 


式 (5-6) 在 计算 时 分 成 了 奇数 项 和 偶数 项 。 
同 理 





GE 





1 二 
FLP+M) = 了 [到 (D+HMD+HNYRCD+AD] 


= 了 [COPDJ+P RD (5-7) 








1 
Pr = 本 pp 一 肥 p epCi) = 用 ? exp(-jzr)=-- (5-8) 
所 以 
1 呈 
FUP+MD)=5[ 尺 (DJ- 榴 及 CD] 
由 式 〈5-7) 和 式 〈5-8) 推导 可 得 FFT 的 定义 式 为 
ACT AL 
2 neieaanmecimNm 了 =01…M-1 
ZP,g) 辫 有 4=01…N-l 人 
1 Al 0 妨 =0.1…,M-1 
人 全 FCp aeiewiOmmeiewmym (5-10) 
7 月 = 名 名 0 =01…,N-1 


可 以 认为 ，F(Pp,9) 是 FUm, 六 的 DFT 系数 。 
在 MATLAB 7.0 中 ， 可 分 别 用 函数 全 0、 伍 20 和 ffn0) 来 计算 一 维 、 
而 其 反 变 换 依次 为 iftO0、ift20 和 ifftn(0)。 

下 面 构建 一 个 类 似 于 图 5-1 所 示 的 矩阵 函数 ， 


维和 7 维 的 
FFT， 
程序 代码 如 下 : 


全 zeros(30,30); 
f5:24,13:17)=1; 

% 显 示 效 果 如 图 5$-4 所 示 
figure, imshow(f'notruesize7; 
F=fh2(D); 

F2=log(abs(F)); 

% 显 示 效 果 如 图 5-5 所 示 


imshow(F2,[.1 5],notruesize)); 






colormap(jet:colorbar 





图 5-$ 


图 5-4 函数 傅 里 叶 变换 幅 值 对 数 图 
针对 分 辨 率 低 和 直流 成 分 显示 区 域 调 整 问题 ， 


函数 来 解决 。 


离散 矩形 函数 


MATLAB 7.0 分 别提 供 了 补 零 和 策 shiftO 














在 计算 离散 
算 可 以 在 一 个 函 






数 的 DFT 时 ， 可 以 通过 对 该 函数 进行 补 零 来 提高 分 辨 率 ， 补 零 和 DFT 计 
数 调用 中 实现 ; 


FE=fR2(fMN); 


其 中 M 和 N 是 足够 大 
例子 ， 可 以 通过 





的 整数 ， 用 于 指定 覆盖 矩阵 的 大 小 ， 超 出 部 分 将 补 零 。 如 上 面 的 
下 面 的 程序 段 来 提高 分 辩 率 。 
F= 仁 2(f256,256); 


imshow(log(abs(F),[L1.5]); 
colormap(jeb:colorbar 


寺 





6 所 示 。 
移动 可 用 全 shift0) 函 数 实现 ; 





f256,256); 






imshow(log(abs(F2)),[.1.5]); 
colormap(iet;colorbar: 


移动 后 的 图 像 如 图 5-7 所 示 。 


吗 rm 





图 5-6 补 零 的 傅 里 叶 变换 图 5-7 移 位 后 的 幅 值 





傅 里 叶 变换 在 图 像 处 理 中 有 着 广泛 的 应 用 ， 下 面 以 几 个 常用 的 例子 进行 简单 的 介绍 。 

1 线性 滤波 器 的 频率 响应 

在 进行 滤波 器 设计 时 ， 要 分 析 所 设计 滤波 器 的 频率 响应 特性 ， 如 通 带 、 起 始 频率 
等 ， 通 过 分 析 ， 看 所 设计 的 滤波 器 是 否 满足 参数 指标 要 求 。 

MATILAB 7.0 提供 了 freqz20 函 数 ， 可 以 对 线性 滤波 器 的 频率 响应 进行 分 析 ， 这 是 因为 
线性 滤波 器 冲击 响应 的 传 里 叶 变换 很 好 地 反映 了 滤波 器 的 频率 响应 特性 。 

以 下 程序 代码 示例 给 出 了 高 斯 滤波 器 的 频率 响应 ， 并 显示 了 滤波 器 的 通 带 特性 。 











h= 全 pecial(' gaussian ); 
freqz2(h) 





2.， 快速 卷 积 





傅 里 叶 变换 的 另 一 个 重要 特性 是 能 够 实现 快速 卷 积 。 由 线性 系统 理论 可 知 ， 两 个 函数 的 
卷 积 的 傅 里 叶 变换 等 于 两 个 函数 的 傅 里 叶 变换 的 乘积 。 该 特性 与 快速 傅 里 叶 变换 一 起 ， 可 以 





快速 计算 函数 的 卷 积 。 


假设 4 为 WMxN 的 矩阵 , 妇 为 Px@ 的 矩阵 ， 则 快速 计算 卷 积 的 方法 如 下 : 
对 4 和 妇 补 零 ， 使 其 大 小 都 为 (M+P-Dx(NW+O-D。 

利用 住 20 函 数 对 4 和 召 分 别 进行 二 维 FFT 变换 。 

将 两 个 FFT 结果 相 乘 ， 利 用 ifh20 函 数 对 乘积 进行 傅 里 叶 变换 。 


举例 如 下 : 


A=magic(3) 
B=ones(G3) 


A(8,8)=0; % 对 矩阵 4 进行 补 堆 
B(8,8)=0; % 对 矩阵 下 进 行 补 零 


Cr=ift2(fh2(A).*fh2(B)); 


C=C(L5.1:5; 
C=real(C) 
程序 执行 的 结果 为 
有 
人 
和 
B= 
1 1 1 
， 1 
1 记 和 
和 
8.0000 。 9.0000 
11.0000 17.0000 


15.0000 ”30.0000 
7.0000 21.0000 
4.0000 13.0000 


15.0000 
30.0000 
45.0000 
30.0000 
15.0000 


7.0000 
19.0000 
30.0000 
23.0000 
11.0000 


6.0000 
13.0000 
15.0000 

9.0000 

2.0000 











其 结果 可 与 直接 调用 MATLAB 7.0 中 的 卷 积 函数 C=conv2(A,B) 相 比较 ， 直 接 用 函数 实 
现 卷 积 结果 如 下 : 


C=conv2(A,B); 
C=C( 





11 1 和: 坊 反 
下 


亚 允 30 23 9 

于 i3 15 11 2 
经 过 比较 ， 两 者 运算 的 结果 相同 。 
3. 图 像 特征 定位 

















傅 里 叶 变 换 可 以 用 于 与 卷 积 密切 相关 的 运算 〈Correlation)。 数 字 图 像 处 理 中 的 相关 运算 
通常 用 于 匹配 模板 ， 还 可 对 某 些 模板 对 应 的 特征 进行 定位 。 例 如 ， 假 如 用 户 希 望 在 图 像 
texttif 中 定位 字母 “a”， 如 图 5-9a 所 示 ， 可 以 采用 下 面 的 方 立 。 

将 包含 字母 “a” 的 图 像 与 图 像 textpng 进行 相关 运算 ， 也 就 是 对 包含 字母 “a” 的 图 像 
和 图 像 textpng 进行 傅 里 叶 变换 ， 然 后 利用 快速 卷 积 的 方法 ， 计 算 字 和 图 像 textpng 
的 卷 积 ， 提 取 卷 积 运算 的 峰值 ， 即 得 到 在 图 像 textpng 中 对 应 字母 “a” 的 定位 结果 。 执 行程 
序 如 下 〈 见 图 5-9b): 







The term watershed di Ins To Des iir He 所 


Ri 
refers to aridge that .… 口哨 里 邹 | 局 臣 - 


四 
上 
局 
后 
外 
中 

至 
三 


drained by different 


river Systems. 





图 5-9 在 图 形 中 定位 字母 “a” 
下 原 图 text. png b) 模板 


bw=imread(textpng); 
3,88:98); 
figure,imshow(bw); 


a=bw(32 





figureiimshow(a); 





所 谓 将 模板 “a” 与 图 像 text.png 进行 相关 运 就 是 先 分 别 对 其 作 快 速 傅 里 叶 变换 ， 然 
后 利用 快速 卷 积 的 方法 ， 计 算 模板 和 图 像 text.png 的 卷 积 ， 如 图 5-10 所 示 ， 并 提取 卷 积 运算 
结果 的 最 大 值 ， 即 图 5-11 所 示 的 白色 亮点 ， 即 得 到 图 像 textpng 中 字母 “a” 的 定位 结果 。 
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图 5-10 模板 和 图 像 textpng 的 卷 积 图 5-11 图 像 textpng 中 字母 “a” 


bw=imread(textpng)); 
ar=bw(32:45,88:98); % 从 图 像 中 提取 字母 “a” 
realiff2(f2(bw).*fh20rot90(a.2)256256))); 
figure,imshow(C,[) 
max(C(C)) 
thresh=60 ”% 设 定 门限 
figure,imshow(C>thresh) 
ans 一 

68 
thresh = 

60 


5.2 ”离散 余弦 变换 


如 果 函 数 fx) 为 一 个 连续 的 





胃 函 数 ， 即 F(zx) = 7(-xz) ， 则 此 函数 的 傅 里 叶 变换 如 下 : 
FoOD) = 你 ed 

四 下 Jocos(2zruojdx-j 六 (xjsin(2mzx)dx 

一 上 ”Ce)cos(2raex)dx 


故 傅 里 叶 变换 的 虚数 项 为 零 ， 由 于 变换 后 的 结果 仅 含有 余 
因此 余 变换 是 傅 里 叶 变换 的 特例 。 










种 可 分 离 变换 ， 设 17Co1xz = 0, …,N-1} 为 离散 的 信号 序列 ， 一 维 


(2x+1)xwr 





CUO=at0)> Jecos 2 ww=012…N-D (5-12) 
各 加 

四 
Ho)= 并 oOCCJeos 人 De C=012…,N-D (5-13) 


wE0 








MATLABaw 


式 中 ， 





〈5-14) 


由 一 维 离散 余弦 变换 对 的 定义 式 可 以 看 出 ， 其 正 、 反 变换 核 均 为 
(Cou=012…,N-D (5-15) 


(2x+Dur 
8g(c2a) = hx,z0 = oa00cos 一 5 


可 见 ， 一 维 DCT 的 逆 变 换 核 与 正 变换 核 是 相同 的 。 


二 维 离散 余弦 变换 
- 维 DCT 的 定义 推广 到 二 维 DCT。 


考虑 到 两 个 变量 ， 很 容易 将 
设 Fox 为 NxN 的 数字 图 像 矩 阵 函数 ， 则 二 维 DCT 变换 对 定义 如 下 
人 Ce os (5-16) 


x=0y=0 





式 中 ，zvy=012…,N-1。 
AI AD 
(2x+TDar cosC2+DI (5-17) 
2N 2N 


Jo7)=ad0)a()2 > al0)a(w)CGuvjcos 


三 0 


50 三 


式 中 ，z%y=01 N-1l。 
出 ， 其 正 、 反 变换 核 为 


由 二 维 离散 余弦 变换 对 的 定义 式 可 以 看 出 
Cxz+Dureos Cu+Dr (5-18) 
2N 





0V)= Am) = S$ 
8 一 Ac 一 aG0)at)cos 5 


式 中 ，a(o) 和 av) 的 定义 同 式 〈5-14)。 

由 此 可 知 ，DCT 的 变换 核 具 有 可 分 离 性 ， 而 且 二 维 DCT 的 正 反 变换 核 是 相同 的 

与 变换 核 为 复 指数 的 DFT 相 比 ， 由 于 DCT 的 变换 核 是 实数 的 余弦 函数 ， 因此 DCT 的 
计算 速度 要 快 ， 已 广泛 用 于 数字 信号 处 理 ， 如 图 像 压 缩编 码 、 语 音信 号 处 理 等 方面 。 


ES 快速 离散 余弦 变换 | 
法 已 经 有 案 ， 一 种 典型 的 算法 就 是 利用 FFT。 


关于 DCT 快速 算法 已 经 有 多 种 方案 
- 维 DCT 和 DFT 具有 相似 性 ， 4 DCT 如 下 : 
CO=- 天 太 呈 /7@ (5-19) 
VN 护 
CGOD)= 上 ee [ee(- 谋 外 | 衬 Xes| -这 j 一 一 5 二 


-eol 避 人 xca[-2e| 
-上 me ore| (5-20) 


x=0 








JoD xx=012… 








对 比 DFT 的 定义 可 以 看 出 ， 将 序列 拓展 之 后 ，DFT 变换 对 应 DCT， 而 虚 部 对 应 
着 离散 正弦 变换 ， 因 此 可 以 利用 FFT 实现 DCT。 这 种 方法 的 缺点 是 将 序列 拓展 了 ， 增 加 了 
- 些 不 必要 的 计算 量 ， 此 外 这 种 处 理 也 容易 造成 误解 。 DCT 是 独立 发 展 的 ， 并 不 是 源 


于 DFT 的 。 GC) 
离散 余弦 应 用 | 








下 面 通 过 一 段 程序 示例 来 说 明 DCT 的 一 些 性 质 ， 如 图 5-12 所 示 。 
程序 代码 如 下 : 


clear 
RGB=imread(F:imagevbaboon .bmp'); 
GRAY=rgb2gray(RGB); 
figure,imshow(GRAY); 
D=dct2(GRAY); 
figure,imshow(logtabs(D)),[]); 
colormaptgray(4))j:colorbar' 
Dabs(D)<0.U=0; 
I=idct2(D)/255; 
figure,imshow(D 
以 上 程序 段 对 所 
所 示 。 由 结果 可 知 ， 
这 说 明 DCT 上 
值 的 系数 归 和 零 






图 像 进行 离散 余弦 变换 ， 如 图 5-12a 所 示 ， 变 换 后 的 结果 如 图 S-12b 
换 后 DCT 系数 能 量 主 要 集中 在 左上 角 ， 其 余 大 部 分 系数 接近 于 零 ， 
有 适用 于 图 像 压 特性 。 将 变换 后 的 DCT 系数 进行 门限 操作 ， 将 小 于 一 定 
ji 进行 道 工 算 ， 得 到 压缩 后 的 图 像 ， 如 图 5-12c 所 示 。 














唱 


图 5-12 余弦 变换 应 用 





a 原始 图 像 卓 9 压缩 后 的 图 像 


比较 变换 前 后 的 图 像 ， 可 以 发 现 视觉 效果 相差 很 小 ， 可 见 压 缩 的 效果 比较 理想 

在 JEPG 图 像 压缩 算法 中 ， 其 基本 原理 是 : 首先 量化 、 编 码 。 传 输 后 ，JPEG 接收 
端 解码 量化 了 的 DCT 计算 每 一 块 的 逆 维 离散 余下 变换 ， 然 后 重组 这 些小 块 成 
为 一 幅 图 像 。 通 常 ， 经 过 变换 后 大 部 分 DCT 系数 都 近似 为 0， 因 此 ， 这 些 系 数 对 重 构 
的 影响 很 小 。 
















5.3 ”离散 沃 尔 什 一 哈达 玛 变 换 ( DWT 一 DHT ) 


前 面 介 绍 的 傅 里 叶 变 换 、 离 散 余弦 变换 及 后 面 将 要 介绍 的 Radon 变换 都 是 由 指数 函数 ， 
即 以 正弦 、 余 弦 三 角 函 数 为 基本 正 交 函数 的 级 数 展开 而 构成 的 。 由 于 在 解决 实际 问题 时 ， 频 
域 法 往往 更 容易 处 理 ， 所 以 以 上 3 种 变换 在 信号 处 理 、 图 像 处 理 以 及 系统 设计 中 得 到 很 广泛 
的 应 用 。 

但 是 ， 傅 里 叶 变 换 和 离散 余弦 变换 在 快速 算法 中 都 要 用 到 复数 乘法 ， 占 用 的 时 间 仍然 比 
较 多 ， 在 某 些 应 用 领域 中 ， 则 需要 更 为 便利 和 有 效 的 变换 方法 。 为 此 ， 本 节 将 介绍 沃 尔 什 
《Walsh) 变换 ， 该 变换 就 是 比较 有 效 的 一 种 变换 方法 。 

沃 尔 什 变换 是 由 两 个 数值 (+1 和 -1) 作为 基本 函数 的 级 数 展开 而 成 的 ， 它 满足 正 交 特 
性 。 由 于 沃 尔 什 函 数 是 二 值 正 交 函 数 ， 两 个 数值 与 数字 逻辑 中 的 两 个 状态 相对 应 ， 因 此 更 适 
合 在 计算 机 技术 、 数 字 信号 处 理 领 域 中 应 用 。 

沃 尔 什 变换 是 在 1923 年 由 美国 数学 家 沃 尔 什 《Walsh) 提出 的 ， 其 原始 论文 中 给 出 了 沃 
尔 什 变换 的 递 推 公式 ， 后 来 法 国 数学 家 哈达 玛 〈Hadamard) 等 利用 只 包含 +1 和 -1 阵 元 的 正 
交 矩 阵 来 表示 沃 尔 什 变换 ， 所 以 沃 尔 什 变换 与 哈达 玛 变换 是 等 价 的 。 与 传 里 叶 变换 相 比 ， 沃 
尔 什 变换 的 主要 优点 在 于 存储 空间 少 和 运算 速度 高 ， 这 一 点 对 图 像 处 理 来 说 至 关 重 要 ， 特 别 
是 在 大 量 数据 需要 进行 实时 处 理 时 ， 沃 尔 什 变换 就 更 显示 出 它 的 优越 性 。 





1. 沃 尔 什 正 交 变 换 
设 /Kx) 表示 N 点 的 一 维 离散 序列 ， 则 一 维 沃 尔 什 正 变换 定义 如 下 : 


FO = 各 JoD CD 55-21) 
VN 气 
52 
其 中 ， 一 维 离散 沃 尔 什 正 变换 的 变换 核 为 
1 (CD 人 (5-22) 





90= 调 CD 
式 中 ，x=0123…,N-Lx=01523…,N-1，N 是 一 维 离散 沃 尔 什 正 变 换 的 阶 数 ， 
N=2"。(x) 是 x 的 二 进 制 数 的 第 守 位 数值 ， 取 值 为 0 或 1。 如 六 6， 由 于 6 的 二 进 制 表示 
为 110， 因此 矶 [=0v (从 =1， 矶 (os=l 
2.， 沃 尔 什 逆 变 换 
一 维 离散 沃 尔 什 逆 变 换 定义 如 下 ， 
1-= 方 呈 7 (CD8ooe 05223) 
式 中 ，x=0152,3…,N-1。 
其 中 ， 一 维 离散 沃 尔 什 逆 变 换 的 变换 核 为 
Hoc) = SOCca0D) 《5-24) 
一 维 沃 尔 什 正 逆 变换 的 变换 核 相 同 ， 沃 尔 什 变换 的 变换 核 是 一 个 对 称 阵列 ， 其 行 和 列 是 








的 。 沃 尔 什 正 、 逆 变换 形式 本 质 上 相同 ， 因 此 ， 计 算 沃 尔 什 正 变 换 的 算法 可 直接 用 来 求 
其 逆 变 换 。 沃 尔 什 正 变换 也 具有 快速 算法 ， 简 称 为 FWT， 在 形式 上 和 FFT 算法 类 似 。 
当 N=8 时 ， 其 变换 核 用 矩阵 表示 如 下 : 








证 和 二 全 GC) 
JI RN 
本 过手 
SS 
本 
风光 二 证 二 ME 
人 
RS 

离散 沃 尔 什 变换 






尔 什 正 变 换 
设 Fo 表示 Mx N 的 二 维 离散 序列 ， 则 二 维 活 尔 什 正 变换 定义 如 下 ， 
Fom)= 等 Joy)gComy 有 (5-25) 
气 扎 


24= 0,12.3…,M-LDv=0123…,N-1 
式 中 ， 二 维 离散 沃 尔 什 正 变换 的 变换 核 为 
1 如 中 eol 吕 weos 
Se C (5-26) 
式 中 ，M=2";N=2"。 
- 维 离散 沃 尔 什 正 变换 的 变换 核 是 可 分 离 的 ， 即 


5 it 旺 四 Co8 ri 
tj 


SCoz 9 (5-27) 
了 全 衬 [bco8 
方 和 DA ”无 (CD 和 二 
VN 握 
= 本 (Gy) 


根据 沃 尔 什 变换 的 定义 形式 可 以 得 出 ， 二 维 沃 尔 什 变换 具有 可 分 离 性 ， 即 一 次 二 维 沃 尔 
什 变换 可 以 通过 二 次 一 维 沃 尔 什 变换 来 实现 。 
2.， 二 维 沃 尔 什 逆 变 换 
二 维 沃 尔 什 逆 变 换 定义 如 下 : 
所 (用 = 条 如 Few yx 〈5-28) 


3 已 
X= 012.3…，M -137=0,123…,N -1 
- 维 离散 沃 尔 什 逆 变 换 的 变换 核 为 
Pei = SCOoT) 
- 维 离散 沃 尔 什 逆 变 换 的 变换 核 为 








1 及 5 号 全 区 ] 卫 
Sn 及 = 记 人 (5-29) 
二 


式 中 三 2 二 2 
同样 ， 二 维 逆 变 换 具 有 可 分 离 性 。 二 维 沃 尔 什 变换 也 可 以 表示 为 矩阵 形式 : 


= 了 TGVD 

7-T 语 7 
式 中 ，GI 为 Mx M 变换 核 方 阵 ，G, 为 VNx N 变换 核 方 阵 。 
沃 尔 什 变换 是 将 一 个 函数 变换 成 取 值 为 +1 或 -1 的 基本 函数 构成 的 级 数 ， 用 它 来 逼近 数 
字 脉 冲 信号 时 要 比 DFT 有 利 。 因 此 ， 它 在 图 像 传输 ， 通 信 技 术 和 数据 压缩 中 获得 了 广泛 的 
应 用 。 同 时 ， 沃 尔 什 变换 是 实数 ， 所 以 对 工程 应 用 问题 ， 沃 尔 什 变换 的 存储 量 比 DFT 少 ， 


(5-30) 


而 且 运算 速度 非常 


一 维 离散 哈达 玛 变 换 








1. 一 维 险 达 玛 正 变换 
设 /Co 表示 N 点 的 一 维 离散 序列 ， 则 0 





总 
Fa= 二 /osgco0=- 天 遍 瑟 /ro Co (5-31) 
把 
2& = 012， N_i 
式 中 ，&g(xe 切 是 一 维 哈达 玛 变换 的 变换 核 ， 
gc)=- 产 避 名 own (5-32) 


式 中 ，x =0,12,3…,N-Lx=012,3…,N-1。N 是 哈达 玛 变换 的 阶 数 ，N =2" 。 忆 (xz) 是 x 
的 二 进 制 数 的 第 ;位 数值 ， 取 值 为 0 或 1。 
2. 一 维 哈 达 玛 逆 变 换 
若 已 知 N 点 的 一 维 离散 序列 F(x) ， 则 可 以 进行 哈达 玛 逆 变换 ， 其 定义 如 下 ; 
JCD 遍 2rwec 1 天 
x=012.3…,N-1 


与 一 维 哈达 玛 正 交 变换 相同 ， Me 丰 是 一 维 哈达 玛 首 变 换 的 变换 核 ， 逆 变换 的 变换 核 与 
正 交 变换 的 变换 核 相等 ， 即 


电 5tos 


《3 


1 六 CO8() 
Aco= SCoa0 = 全 (5-34) 


哈达 玛 变换 的 阶 数 具 有 规律 性 ， 即 按照 N = 2" 规律 递 升 ， 高 阶 哈达 玛 和 矩阵 可 以 通过 低 阶 
哈达 玛 和 矩阵 的 克 罗 尼 科 积 运算 求 得 ， 也 就 是 说 ， 哈 达 玛 矩阵 具有 如 下 关系 ; 
1) 妃 =() 











全 二 
芝 -|! -1 1 -1! 
1 
1-l1-l 1 
IN 
4) 2 忆 -有 
2 2 
采用 上 述 规律 求 哈达 玛 变换 矩阵 要 比 直接 用 哈达 玛 变换 的 变换 核 求 矩阵 快 得 多 ， 此 结论 
提供 了 一 种 快速 哈达 玛 变换 ， 也 可 以 称 为 FHT。 例 如 ， 根 据 哈 达 玛 矩阵 的 运算 规律 ， 可 以 得 
出 8 阶 哈达 玛 和 矩阵 如 下 : 
EU 
7 
不 
太 - 人 各 并 二 
| 
人 
人) 和 
1L-I-L1i-L 1 1- 





二 维 离散 哈达 玛 变换 


一 维 哈达 玛 变换 可 以 很 方便 地 推广 到 二 维 ， 其 正 变换 定义 如 下 : 
ATI 


Foov)= 2 之， DJ)gOcayny) (5-35) 


5 3 于 1 ,oo 
jx 帮 = re V)hca (5-36) 
一 


0 

二 呈 呈 Po 汪 芝 1 ,oo 
1 

二 维 哈达 玛 正 变换 核 为 


闸 志 5 二 二 全 
SC 之 加 到 (5-37) 


VMN 气 扣 
式 中 ，zu= 012,3…,M -Lpny=012,3…,N-1。 二 维 哈达 玛 逆 变换 核 与 正 变换 核 相等 ， 
即 
Hz = SO y) 
二 维 哈达 玛 变换 核 是 可 分 离 和 对 称 的 ， 因 此 一 次 二 维 哈达 玛 变换 也 可 通过 两 次 一 维 哈达 











变换 的 应 用 举例 


下 面 是 简单 的 离散 沃 尔 什 一 哈达 玛 变换 CDWT 一 DHT) 的 应 用 实例 。 


实例 1 有 两 个 二 维 数字 图 像 信号 如 下 : 
了 本 


分 别 求 矿 和 万 的 二 维 沃 尔 什 变换 。 
离散 二 维 沃 尔 什 变换 的 过 程 如 下 : 


ww ww 
ww wm ww 


解 : 根据 理论 ， 对 于 (1) 和 (2)， 均 有 AM =N=4， 因 此 ， 


人 
1 -1 1-! 
1 1 -1 -1! 
NT 
由 此 可 得 
人 
1l1-1 1-11 
五 
| 于 于 和 
ti-i- UL1 
1 
咱 950S00 
|oooo0 
0000 
是 
症 | 且 人 > 
古 
多 
1 
2 00-! 
号 
2 了 | 有 “有 
000 0 


其 二 维 沃 尔 什 变换 核 为 





2123] 
fork=1:4 


wht(:oO=hadamard(2)*sq(:,k)/2 
本 局 
%9%%% 对 每 一 列 进行 沃 尔 什 一 哈达 玛 变换 ， 得 到 wht 
forj=1:2 
a=wht(,:) 
hadamard(4) 
wh(:j)=hadamard(4)*wht(,:)V4 
end 
%%%%%%%6%% 的 每 一 行进 行 沃 尔 什 一 哈达 玛 变换 ， 得 到 wh 
wh=wh' % 重 排 


运行 结果 为 


wht= 


1.0000 2.5000 1.5000 
0 0.5000 -0.5000 





1.6250 0.3750 -0.3750 -0.1250 
-0.1250 0.1250 -0.1250 -0.3750 


实例 3: 对 二 维 图 像 进行 沃 尔 什 一 哈达 玛 变换 ， 程 序 如 下 : 


clear 

T=zeros(2.^8); 
1T(2.^7-2.^4+1:2.^7+2.^4,2.^7-2.^4+1:2.^7+2.A4)=ones(2*2.^4); 
figure; 

colormap(gray(128))imagesc(D; % 显 示 数 据 

[mn]-size(D % 数 据 维 数 


fork=l:n 

wht(:k)=hadamard(m)*I(:k)/m; % 对 每 一 列 进行 沃 尔 什 一 哈达 玛 变换 
end 
forj=l:m 


wh(Gj)Fhadamard(m*wht(,:)yn; % 对 进行 列 的 沃 尔 什 一 哈达 玛 变换 后 的 
%% 系 数 进行 沃 尔 什 一 哈达 玛 变换 
end 
wh=wh' 
figure; 
colormap(gray(128))imagesc(wh; 


程序 运行 结果 如 下 〈 见 图 5-13): 














图 5-13 对 二 维 图 像 进行 沃 尔 什 一 哈达 玛 





成 





原始 图 像 ”b) 沃 尔 什 一 哈达 玛 





旭 系 数 


5.4 K-L 变换 


|KL 变换 的 定义 


将 一 组 离散 信号 变换 为 不 相关 数列 的 变换 方法 称 为 Hotelling 变换 


H.Karhunen 和 M.Loeve 等 人 提出 将 连续 信号 变换 为 一 组 不 相关 数列 的 ， 


由 于 是 由 
所 以 也 将 


Hotelling 变换 称 为 K-L 变换 。 这 种 变换 是 建立 在 图 像 统 计 特性 基础 上 的 ， 其 变换 核 矩 阵 
由 图 像 陈列 协 方差 矩阵 的 特征 值 和 特征 向 量 决定 ， 所 以 ，K-L 变换 也 称 为 特征 向 量变 换 或 


主 分 量变 换 。 
假定 一 幅 Nx N 的 数字 
二 扰 ， 接 收 到 的 图 售 








个 受 噪 声 干 扰 的 数字 图 像 集合 。 
攻 0 CD 
写成 M 个 M 维 向 量 [XXX 
XI 向 量 可 采用 行 堆 各 或 列 堆 麦 的 方法 构成 ， 即 
8 厂 (0.0) 
矿 (0.D) 


1(0N-D 
万 (0) 


JN-D 
放 ON-10) 


放 (ON-LN-D 
愉 向 量 的 协 方差 矩阵 定义 为 


图 像 通过 某 一 信号 通道 传输 了 M 次 ， 由 于 受到 各 种 因素 的 随机 


5Xv 的 形式 ， 其 中 ， 第 六 次 获得 了 图 像 foxy) 所 对 应 的 


《5-38) 





Cr =E{X-mr)(X-mar) (5-39) 
式 中 ， 巨 为 期 望 ，T 为 转 置 。 


平均 值 向 量 my 定义 为 
mr = 已 CC} (5-40) 
对 于 M 幅 数 字 图 像 ， 平 均值 向 量 mr 和 协 方差 矩阵 Cr 可 由 下 述 方法 近似 求 得 : 
1 妈 
人 (5-41) 
风 
Cr =EX-mr)X -mr 一 十 2 Oo 一 mar)(CX 一 mr 和 (5-42) 


1 中 二 
站 人 


由 此 可 知 ，myr 是 N 个 元 素 的 向 量 ，Cyr 是 N? x N? 的 方 阵 。 


设 4G=12,…,N2) 是 按 递减 顺序 排列 的 协 方差 矩阵 的 特征 值 ，e6 = [eea,ewv 工 
(G=12,…,N2) 是 协 方差 矩阵 的 特征 向 量 。 
则 定义 K-L 变换 矩阵 4 为 


= 请 
同 | 攻 ， 鸡 攻 2 
| 了 (5-43) 
El ez ”ep 
从 而 可 得 K-L 变换 的 表达 式 为 
=4(X-mh) (5-44) 


式 中 ， 光 一 my 是 原始 图 像 向 量 X 减 去 平均 值 向 量 略 r ， 称 为 中 心 化 图 像 向 量 。 此 式 5-44) 表 
明 ， 变 换 后 的 图 像 向 量 了 等 于 中 心 化 图 像 向 量 大 - my 与 变换 矩阵 4 的 乘积 。 


网 K-L 变换 的 性 质 





1) 变换 后 的 图 像 向 量 了 的 平均 值 向 量 my = 0 ， 即 为 零 向 量 。 

证 明 : mr = ETJ=EL4CX-mr=4EC-4nar=0 (5-45) 

2) 了 了 向量 的 协 方差 矩阵 Cy = E{( mr) 一 mr)}= ETZT} 

把 式 (5-44) 代入 ， 得 
Cr =Ef(4X-4mar)(C4X 一 4nzr) 

= EL4(X 一 mar)( 刁 一 mr)4 
=4E{(X-mr)( 呈 mr) 4 
=4C7 丰 

3 ) 协 方差 矩阵 Cy 是 对 角 型 矩阵 ， 其 对 角 线 上 的 元 素 等 于 cy 的 特征 值 汶 ， 


(5-46) 








1 (5-47) 


2 
Cr 非 对 角 线 上 的 元 素 值 为 0， 说 明 变 换 后 向 量 节 的 像素 是 不 相关 的 ;而 非 对 角 线 上 的 
元 素 值 不 为 0， 说 明 原 始 图 像 元 素 之 间 的 相关 性 强 。 因 此 ，K-L 变换 的 优点 是 去 相关 性 好 。 
4) K-L 反 变换 。 因 为 Cr 是 实 对 称 和 矩阵， 所 以 总 可 以 找到 一 个 标准 正 交 的 特征 向 量 集 
合 ， 使 得 4 = 4 ， 则 可 得 到 K-L 反 变换 公式 : 
天 = 4 了 二 my (5-48) 
总 之 ， 离 散 K-L 变换 的 最 大 优点 是 去 相关 性 好 ， 可 用 于 数据 压缩 和 图 像 旋转 。 离 散 K-L 
变换 应 用 的 主要 困难 就 是 由 协 方差 矩阵 Cy 求 特 征 值 和 特征 向 量 解 方程 的 计算 量 问题 ， 同 
时 ，K-L 变换 是 不 可 分 离 的 ， 一 般 情况 下 ，K-L 变换 没有 快速 算法 。 


5.5 Radon 变换 


EL adon 过 Ra |] 


常用 的 CT 〈X 射线 计算 机 层 析 摄 影 仪 ) 扫描 ， 其 原理 是 基于 不 同 的 物质 有 不 同 的 X 射 
线 衰减 系数 ， 如 果 能 确定 人 体 衰 减 系数 的 分 布 ， 就 能 重建 其 断层 或 三 维 图 像 。 但 通过 X 射线 
透射 时 ， 只 能 测量 到 人 体 直线 上 的 X 射线 衰减 系数 的 平均 值 〈 是 一 个 积分 )。 当 直线 变化 
时 ， 此 平均 值 〈 依 赖 于 某 参 数 ) 也 随 之 变化 ， 这 样 就 不 能 很 好 地 重建 断层 。 但 是 ， 能 否 通过 
扫描 测量 的 平均 值 求 整个 衰减 系数 的 分 布 ， 从 而 有 效 地 重建 图 像 呢 ? Radon 变换 为 解决 此 类 
问题 提供 了 很 好 的 思路 。 

Radon(0) 函 数 的 作用 是 计算 指定 方向 上 图 像 的 投影 ， 对 应 的 二 元 函数 /tx,y) ， 则 是 计算 
该 函数 在 某 一 个 方向 上 的 线 积 分 。 例 如 ， 7(x,y) 在 垂直 方向 上 的 线 积分 即 是 xc, 妨 在 x 轴 
上 的 投影 ， 而 在 水 平方 向 上 的 线 积分 则 是 .Fr(x,?) 在 轴 上 的 投影 ， 如 图 5-14 所 示 

而 同样 的 投影 可 以 沿 任意 角 @ 进行 ， 一 般 来 说 ， 函 数 /(x,7 的 Radon 变换 就 是 沿 着 了 
轴 进 行 线 积分 。 

Radon 变换 的 定义 如 下 : 











Ro(x)= 册 Jeecosg-ysingxsing+Jcosg)dy 


zfeosg sing1fx 
YY 外 \-sing cos6 八 ， 


Radon( ) 函 数 的 几何 关系 示意 图 如 图 5-15 所 示 。 


(5-49) 

















和 刘 
影 
到 
过 
轴 
投影 到 x 轴 
图 5-14 ”函数 水 平和 垂直 投影 示意 图 图 5-15 Radon 函数 的 几何 关系 示意 图 
MATLAB 提供 了 函数 [ R.xp ]-radon(I , theta) 来 计算 图 像 I 的 Radon 变换 。 其 中 I 为 待 处 
理 图 像 ，theta 为 投射 角度 。 


其 中 ，R 记录 了 图 像 I 沿 theta 方向 上 的 Radon 变换 值 ，xp 则 对 应 于 x' 轴 的 坐标 值 。 图 
像 工 的 中 心 点 位 于 floor(( size(D+1)/2)， 即 x 轴 上 x' =0。 

下 面 ， 利 用 MATLAB 仿真 程序 计算 图 5-16b 在 30” 和 90” 上 的 Radon 变换 。 变 换 结 
果 如 图 $-16a、c 所 示 。 





人 ) b) o) 
图 5-16 30” 和 90” 方 向 上 的 Radon 变换 及 原始 图 像 
引 30” 方 向 上 的 Radon 变换 b) 产生 原始 图 像 ec) 90” 方 向 上 的 Radon 变换 


玉 zeros(100,100); 
TI(25:75,25:75)=1; 
figureimshow(D; 
[R.xp]=radon(L[30 90]); 
figure,plot(xp,R(,1DD); 
figure,plot(xp,R(:,2)); 


当然 ， 也 可 以 计算 多 个 角度 的 Radon 变换 ， 并 且 表 示 为 一 幅 图 像 。 例 如 ， 可 以 沿 0"” 一 
180” 每 隔 1” 作 方形 图 的 一 组 Radon 变换 ， 程 序 代码 示例 如 下 ， 变 换 结 果 如 图 5-17 所 示 。 
二 zeros(100,100); 
1(25:75,25:75)=1; 
theta=0:180; 
[R,xp]=radon(Ltheta); 


< 


MIATILABB_ 六 了 四 和 处 理 


ES 











imagesc(theta,xp,R); 
xlabel(vtheta(degrees)7; 
ylabel(Xprimey; 
set(gcaXTick',0:20:180); 
colormap(hot); 





colorbar 
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图 5-17 从 0” 一 180” 每 隔 1” 进 行 Radon 变换 的 结果 


用 Radon 变换 检测 ] 
Radon 变换 与 计算 机 视觉 中 常用 的 Hough 变换 很 相似 。 可 以 利用 Radon() 函 数 来 实现 
Hough 变换 ， 并 进行 直线 检测 。 
以 下 程序 示例 将 说 明 如 何在 MATLAB 中 通过 程序 仿真 ， 利 用 Radon 变换 来 
检测 。 
首先 ， 对 于 已 有 的 原始 图 像 ， 如 图 5-18a 所 示 ， 用 edge(O) 函 数 计算 该 图 像 边 缘 的 二 值 图 
像 ， 边 缘 检 测 结果 如 图 5-18b 所 示 ， 得 到 候选 的 边缘 线条 。 








实现 直线 的 





a) b) 
图 5-18 用 Radon 变换 进行 边缘 直线 检测 


a) 原始 图 像 b) 边 络 








程序 代码 如 下 


=fitsread('solarspectra.fts); 
Imat2gray(D); 
BW=edge(D; 
figurejimshow(D; 
figure,imshow(BW); 


然后 利用 Radon(0) 函 数 ， 计 算 边 缘 图 像 的 Radon 变换 ， 变 换 结果 如 图 5$-19 所 示 。 
程序 代码 如 下 : 

fitsread(solarspectra.fts); 

I=mat2gray(D); 

BW=edge(D); 

theta=0:179; 

[Rxp]=radon(BW,theta); 

figure,imagesctthetaxp,R);colormap(hot; 

xlabel(vtheta(degrees)):ylabel(CXVprimey; 

colorbar 
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图 5-19 图 5-18 边缘 的 Radon 变换 结果 








逆 Radon 变换 及 其 应 用 

MATLAB 7.0 图 像 处 理工 具 箱 提供 了 iradon0 函 数 用 于 实现 Radon 变换 ， 志 

影 成 像 值 。 这 个 变换 能 把 Radon 变换 反 变 换 回来 ， 因 此 可 以 从 投影 数据 重建 原始 图 像 。 

给 定 图 像 和 一 系列 角度 theta，radon0) 函 数 可 以 用 来 计算 图 像 的 Radon 变换 ， 表 达 式 为 
R=Radon(R,theta)。 计 算 道 Radon 变换 可 以 重建 图 像 ， 其 表达 式 为 IR=iradon(R,theta)。 

这 个 重建 图 像 的 例子 中 ， 投 影 R 是 由 原始 图 像 计算 得 到 的 。 然 而 ， 在 大 多 数 的 应 用 例 
子 中 ， 并 没有 得 到 当前 投影 的 原始 图 像 。 例 如 ，X 射线 吸收 断层 摄影 术 ， 投 影 是 通过 测量 X 
射线 在 不 同 角度 通过 物理 切片 时 的 衰减 得 到 的 。 原 始 图 像 可 以 认为 是 切片 的 一 个 截面 ， 图 像 
的 灰 度 代表 切 片 变 。 投 影 通过 特殊 的 硬件 设备 获得 ， 而 切片 内 部 图 像 通 过 iradon 函数 重 
建 。 这 样 可 以 对 活 的 生物 体 或 不 透明 物体 实现 无 损 成 像 。 

iradon() 函 数 通过 平行 波束 的 投影 来 重建 图 像 。 在 平行 波束 的 几何 关系 中 ， 每 个 投影 通过 

















把 以 特定 角度 穿 过 图 像 的 一 系列 线 积分 组 合 得 到 。 如 图 5-20 所 示 为 平行 波束 几何 在 X 射线 
吸收 断层 摄影 术 上 的 应 用 。 注 意 ， 在 平行 波束 的 几何 关系 中 ， 有 相同 数目 的 辐射 器 和 接收 
器 ， 辐 射 的 衰减 代表 物体 的 密度 、 质 量 等 的 积分 ， 这 相当 于 Radon 变换 中 的 线 积 分 。 

图 5-20 中 照射 波束 的 关系 是 平行 的 ， 与 Radon 变换 的 几何 关系 相同 。 F(x,y) 代表 图 像 
亮度 ，Ro(Cxz) 代 表 6 方向 上 的 投影 。 

另外 一 种 几何 关系 是 扇形 波束 ， 即 只 有 一 个 辐射 器 而 有 多 个 接收 器 ， 扇 形 波束 投影 可 以 
转换 成 平行 波束 投影 ， 利 用 逆 Radon 变换 来 重建 图 像 。 其 几何 关系 如 图 5-21 所 示 。 









旋转 角 theta 


投影 中 心 
图 5-20 “平行 波束 几何 关系 图 5-21 “ 肩 形 波束 几何 关系 
iradon() 函 数 利用 滤波 后 的 投影 算法 来 计算 疼 Radon 变换 。 这 种 算法 利用 R 各 列 中 的 投 
影 来 构造 图 像 I 的 近似 值 ， 若 要 获得 更 准确 的 图 像 ， 可 以 使 用 更 多 的 投影 值 ， 投 影 数 越 多 ， 
重建 的 图 像 越 接 近 原始 图 像 。theta0 矢 量 必须 是 固定 增 量 的 均匀 和 矩阵 ， 即 角度 每 次 的 增 量 值 
Ag 为 常数 。 若 A6 已 知 ， 可 作为 参数 取代 theta 值 ， 传 入 iradon0 函 数 。 例 如 : 


IR=iradon(R, Dtheta); 


滤波 Radon 变换 是 首先 对 投影 R 滤波 ， 再 用 滤波 后 的 投影 值 重建 图 像 。 有 些 情 况 下 ， 投 影 
值 含有 噪声 。Iradon0 函 数 中 可 以 采用 多 种 窗 函 数 ， 下 面 的 例子 采用 了 hamming 窗 函 数 来 滤波 。 





了 =iradon(R ,thetavbhamming?); 

iradon0 函 数 也 允许 指定 归 一 化 频率 D， 高 于 D 的 滤波 器 响应 为 0， 整 个 滤波 器 压缩 在 
[0，D] 内 。 这 在 投影 时 可 以 有 效 抑制 高 频 噪声 的 干扰 ， 而 减少 对 图 像 重建 的 影响 。 下 面 调用 
iradon(0) 函 数 ， 设 定 归 一 化 频率 为 0. 85。 





IR=iradon(R, theta ,0. 85); 


接 下 来 介绍 如 何 利用 Radon0) 函 数 和 iradon0) 函 数 构造 一 个 简单 图 像 的 投影 并 重建 图 像 。 

测试 图 像 是 Shepp-Logan 的 大 脑 幻影 图 ， 利 用 MATLAB 7.0 图 像 处 理工 具 箱 的 phantom() 
函数 可 以 产生 数据 。Shepp-Logan 的 大 脑 幻 影 图 反映 了 真实 世界 中 人 类 大 脑 的 很 多 性 质 。 图 
像 中 外 部 的 椭圆 形 是 头骨 ， 内 部 的 椭圆 是 人 脑 的 内 部 特征 或 者 是 肿瘤 。 

首先 ， 产 生 如 图 5-22 所 示 的 256 个 灰 度 等 级 的 大 脑 幻 影 图 ， 相 应 的 程序 命令 如 下 ， 








图 像 频 域 变换 





P=phantom(256); 


figure,imshow(P); 






束 ，R2 有 36 





| 的 Radon 变换 ，R1 有 18 条 投影 光 





的 大 脑 幻影 
光束 : 


包 





thetal=0:10:170; 
[RLxp]-radon(Pthetal) 


theta2=0:5:175; 
[R2.xpj=radon(P.theta2); 
theta3=-0:2:178; 

[R3,xp]=radon(P,theta3); 








束 的 Radon 变换 图 形 ， 即 


显示 Shepp-Logan 大 脑 幻影 


结果 如 图 5-23 所 示 





图 的 有 90 条 投影 


esc(theta3,xp,R3); 





figure,imag 
colormap(hob:colorbar'， 
xlabel(wtheta):ylabel(x\prime)) 


sara 





的 Radon 变换 





的 90 条 投影 





图 5-23 大脑 





图 5-22 ”大脑 的 双 





j R1、R2 和 R3 分 别 进行 Shepp-Logan 大 脑 幻 影 图 的 重建 ， 结 果 如 图 5-24 所 示 





b) 用 R2 重建 图 像 “) 用 R3 重建 图 像 


a 用 R1 重建 图 像 





BE 








Tl=iradon(R1.107); 
IT2=iradon(R2,5); 
DB=iradon(R3,2); 
figureiimshow(ID; 
figurejimshow(I2); 


figure,imshow(I3) 


5.6 小 波 变换 


小 波 变换 编码 是 近年 来 随 着 小 波 变换 理论 的 研究 而 提出 的 一 种 具有 很 好 发 展 前 景 的 编码 
方法 。 作 为 一 种 多 分 辩 率 分 析 方法 ， 由 于 小 波 变换 具有 很 好 的 时 - 频 和 空 - 频 局 部 特性 ， 特 别 
适合 按照 人 类 视觉 系统 的 特性 设计 图 像 压 缩编 码 方案 ， 也 非常 有 利于 图 像 的 分 层 传输 。 实 验 
证 明 ， 图 像 的 小 波 变换 编码 ， 在 压缩 比 和 编码 质量 方面 优 于 传统 的 DCT 变换 编码 。 





传统 变换 方法 在 信号 分 析 中 存在 着 许多 不 足 之 处 ， 这 是 小 波 变换 方法 的 研究 越 来 越 受 到 
人 们 重视 的 一 个 重要 原因 。 和 小 波 变换 相 比 ， 传 统 变换 方法 的 局 限 性 主要 表现 在 以 下 两 个 方 
面 。 











1 对 了 瞬 态 和 局 部 信号 分 量 的 分 析 

以 最 具有 代表 性 的 傅 里 叶 变换 为 例 ， 其 正 交 基 函 数 是 正弦 信号 ， 又 叫 正弦 波 ， 即 这 是 一 
种 波 〈Wave)。 这 是 因为 ， 一 方面 这 是 一 种 波动 ， 即 等 幅 振荡 ， 另 一 方面 它 在 两 个 方向 上 都 
是 无 限 延伸 的 ， 就 像 海 洋 中 的 波浪 一 样 。 

瞬 态 信号 只 在 很 短 的 间隔 上 是 非 零 的 ， 而 图 像 中 的 许多 重要 特征 ， 如 边缘 等 ， 在 空间 位 
置 上 都 是 高 度 局 部 性 的 。 这 些 瞬 态 或 局 部 信号 分 量 和 伟 里 叶 变换 的 任何 基 函 数 都 毫 无 相似 之 
处 ， 因 而 不 能 由 其 变换 系数 紧密 地 表示 ， 这 就 使 傅 里 叶 变 换 和 其 他 传统 的 基于 波 的 变换 在 分 
析 和 压缩 含有 信号 分 量 时 性 能 不 佳 。 

2 时- 频 和 空 - 频 局 部 化 

在 图 像 分 析 时 ， 有 时 需要 将 信号 在 时 域 和 频 域 中 的 特性 或 信号 在 空域 和 频 域 中 的 特性 结 
合 起 来 进行 分 析 。 例 如 ， 要 了 解 图 像 的 哪 一 部 分 含有 较 多 的 高 频 分 量 ， 或 者 某 一 段 频率 分 量 
的 分 布 情况 等 ， 这 都 是 传统 变换 方法 所 无 法 解决 的 。 

虽然 傅 里 叶 变 换 能 够 将 任何 解析 函数 甚至 很 窗 的 瞬 态 信号 表示 为 正弦 波 之 和 ， 然 而 这 要 
靠 若干 正弦 波 的 复杂 组 合 才能 形成 一 个 在 大 部 分 区 间 上 为 零 的 函数 ， 这 虽然 是 使 变换 成 为 可 
逆 的 有 效 方法 ， 但 却 使 函数 的 频谱 与 函数 本 身 看 起 来 截然 不 同 。 

在 注意 到 傅 里 叶 变换 的 弱点 后 ，Gabor 于 1946 年 提出 了 信号 的 时 - 频 局 部 化 的 分 析 方 
法 ， 就 是 人 们 通常 说 的 Gabor 变换 ， 也 称 为 加 窗 的 傅 里 叶 变 换 。 

信号 AD 的 Gabor 变换 定义 如 下 : 


wo= [go-oyOed (5-50) 














站 


式 中 ， 西数 &D=- 启 e 被 称 为 窗 函数 。 变 换 被 限定 在 窗口 中 进行 ， 比 起 在 无 限 大 空间 的 


傅 里 叶 变 换 有 所 进步 ， 但 是 仍 有 局 限 性 。 因 为 无 论 g(r) 是 什么 样 的 窗 函 数 ， 时 窗 g(z) 的 宽度 
与 频 窗 &(w) 的 宽度 之 积 不 小 于 1/r ， 所 以 当 确定 某 一 个 窗 函数 后 ， 若 其 频 宽 对 应 于 某 一 个 频 
段 ， 其 时 宽 则 不 能 太 窗 。 为 了 提高 局 部 的 可 观察 性 ， 则 需要 加 大 窗口 ， 这 样 导 致 计算 量 大 
增 ， 以 致 无 法 具体 实现 。 


为 了 克服 上 述 缺 点 ， 数 学 家 们 探索 采用 有 限 区 间 
上 的 基 函 数 进行 变换 。 这 些 基 函数 不 仅 频率 是 可 变 有 j W 此 
的 ， 而 且 位 置 也 是 可 变 的 ， 这 就 是 小 波 一 二 有 限 区 间 


上 的 波 ， 如 图 5-25 所 示 给 出 了 小 波 曲线 。 小 波 之 所 人 

以 小 ， 是 因为 它 有 衰减 性 ， 即 是 局 部 非 零 的， 而 称 为 波 ， 则 是 因为 它 有 波动 性 ， 即 其 
取 值 呈 正 负 相 间 的 振荡 形式 。 由 于 小 波 在 频率 和 时 间或 空间 位 置 上 都 是 可 变 的 ， 所 以 
具有 很 好 的 时 - 频 或 空 - 频 局 部 特性 。 


小 波 变 换 的 基本 知识 


1. 连续 小 波 变换 CCWT) 
所 谓 小 波 〈Wavelety， 即 存在 于 一 个 较 小 区 域 的 波 。 小 波 函 数 的 数学 定义 是 : 设 w(z) 为 
平方 可 积 函 数 ， 即 w(D)e EC(R) ， 若 其 傅 里 叶 变换 wy(w) 满足 条 件 : 


化 本 局 本 (5-51) 
四 


则 称 w(z) 为 一 个 基本 小 波 或 波 母 函 数 ， 并 称 式 〈5-48) 是 小 波 函数 的 可 允许 条 件 。 
根据 小 波 函 数 的 定义 ， 小 波 函 数 一 般 在 时 域 具有 紧 支 集 或 近似 紧 支 集 ， 即 函数 的 非 零 值 
定义 域 具有 有 限 的 范围 ， 这 即 所 谓 “ 小 ”的 特点 。 另 一 方面 ， 根 据 可 允许 性 条 件 可 知 
w(@O)le=o=0， 即 直流 分 量 为 零 ， 因 此 小 波 具有 正 负 交 替 的 波动 性 。 
将 小 波 母 函 数 wy(D) 进行 伸缩 和 平移 ， 设 其 伸缩 因子 〈 亦 称 尺 度 因子 ) 为 @ ， 平 移 因子 为 
F ， 并 记 平移 伸缩 后 的 函数 为 ws:(D) ， 则 ; 























woO=eoy 人 5] (ao>0re 有 ) (5-52) 


并 称 yur(t) 为 参数 4 和 的 小 波 基 函 数 。 由 于 wa 和 z 均 取 连 续 变化 的 值 ， 因 此 又 称 为 连续 小 
波 基 函 数 ， 它 们 是 由 同一 母 函 数 %(i) 经 伸缩 和 平移 后 得 到 的 一 组 函数 。 


将 忆 (R) 空间 的 任意 函数 Fo) 在 小 波 基 函 数 下 展开 ， 称 其 为 函数 rz) 的 连续 小 波 变换 
(CCWT)， 变 换 式 为 


mn- 三 rov[ 宇 上 (5-53) 





式 中 ， y[ 生 je 为 小 让 基 两 数 的 共 俩 函 数 。 


刘 





CWT 的 变换 结果 是 许多 小 波 系数 Ty (a,r) ， 这 些 系数 是 缩放 因子 和 平移 的 函数 。 小 波 
变换 是 通过 缩放 母 小 波 的 宽度 来 获得 信号 的 频率 特征 ， 通 过 平移 母 小 波 来 获得 信号 的 时 间 信 
息 。 对 母 小 波 的 缩放 和 平移 操作 是 为 了 计算 小 波 系数 ， 这 些小 波 系数 反映 了 小 波 和 局 部 信号 
之 间 的 相关 程度 。 

其 小 波 母 函数 w(D 缩放 和 平移 的 操作 含义 如 下 。 

缩放 就 是 压缩 或 伸展 基本 小 波 。 小 波 的 缩放 因子 与 信号 频率 之 间 的 关系 是 : 缩放 因子 越 
小 ， 小 波 越 窗 ， 度 量 的 是 信号 的 细节 变化 ， 表 示 信 号 频率 越 高 ， 缩 放 因子 越 大 ， 小 波 越 宽 ， 
度量 的 是 信号 的 粗糙 程度 ， 表 示 信 和 号 频率 越 低 。 小 波 的 缩放 操作 如 图 5-26 所 示 。 

平移 就 是 小 波 的 延迟 或 超前 ， 如 图 5-27 所 示 。 
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图 5-26 “小波 的 缩放 操作 图 5-27 小 波 的 平移 操作 











CWT 计算 主要 有 如 下 5 个 步骤 ， 

1) 取 一 个 小 波 ， 将 其 与 原始 信号 的 开始 一 节 进 行 比较 。 

2) 计算 数值 FT 。 7T7 表示 小 波 与 所 取 一 节 信 号 的 相似 程度 。 计 算 结果 取决 于 所 选 小 
波 的 形状 。 

芍 移动 小 波 ， 重 复 第 1) 步 和 第 2) 步 ， 直 到 覆盖 整个 信号 

4) 伸展 小 波 ， 重 复 1) 一 3) 步 。 

5) 对 于 所 有 缩放 ， 重 复 1) 一 4) 步 。 

在 具体 应 用 中 ， 需 要 根据 原 函数 Ai) 的 特点 来 选择 小 波 基 函 数 w(z) ， 使 得 小 波 变换 能 
更 好 地 反映 函数 ,Fi) 的 特征 ， 下 面 是 一 些小 波 基 函 数 的 例子 。 

1) 哈 尔 (Haar) 小 波 ， 如 图 5-28 所 示 。 其 表达 式 为 


1 0<t<L2 
wOD=1-1 LU2<t<1l (5-54) 
0 其 他 





2) 墨西哥 帽 小 波 ， 如 图 5-29 所 示 。 其 表达 式 为 





(1-P)e (5-55) 


yO=- 声 
FE 








籽 ( (0D) 

















图 5-28 ”Haar 小 波 图 5-29 墨西哥 帽 小 波 


2 离散 小 波 变换 CDWT) 

在 计算 机 应 用 中 ， 连 续 小 波 应 该 离散 化 ， 这 里 的 离散 化 是 针对 连续 尺度 参数 a 和 连续 平 
移 参数 r 的 ， 而 不 是 针对 时 间 变 量 ! 的 。 为 了 使 小 波 变换 具有 可 变化 的 时 间 和 频率 分 辩 率 ， 
常常 需要 改变 尺度 参数 a 和 平移 参数 z 的 大 小 ， 即 采用 动态 采样 网 格 ， 以 使 小 波 变换 具有 
“变焦 距 ”的 功能 。 小 波 分 解 的 意义 在 于 能 够 在 不 同 尺度 上 对 信号 进行 分 析 ， 而 且 对 不 同 尺 
度 的 选择 可 以 根据 不 同 的 目的 来 确定 。 在 这 种 意义 下 ， 小 波 变换 被 称 为 数学 显微镜 。 这 就 使 
分 析 十 分 有 效 ， 并 且 也 是 相当 精确 的 ， 因 此 就 得 到 所 谓 的 离散 小 波 变换 。 

实际 上 ， 人 们 是 在 一 定 尺度 上 认识 信号 的 。 人 的 感官 和 物理 仪器 都 有 一 定 的 分 辨 率 ， 对 
低 于 一 定 尺 度 信号 的 细节 是 无 法 认识 的 ， 因 此 对 低 于 一 定 尺度 信号 的 研究 也 是 没有 意义 的 。 
因此 ， 应 该 将 信号 分 解 为 对 应 不 同 尺度 的 近似 分 量 和 细节 分 量 。 信 号 的 近似 分 量 是 大 的 缩放 
因子 计算 的 系数 ， 一 般 为 信号 的 低频 分 量 ， 包 含 着 信号 的 主要 特征 ， 细 节 分 量 是 小 的 缩放 因 
子 计算 的 系数 ， 一 般 为 信号 的 高 频 分 量 ， 给 出 信号 的 细节 或 差别 。 对 信号 的 小 波 分 解 可 以 等 
效 于 信号 通过 了 一 个 滤波 器 组 ， 其 中 一 个 滤波 器 为 低 通 滤波 器 ， 另 一 个 为 高 通 滤波 器 ， 分 别 
得 到 信号 的 近似 值 和 细节 值 ， 如 图 5-30 所 示 。 

由 图 5-30 可 以 看 出 ， 离 散 小 波 变换 可 以 表示 成 由 低 通 滤波 器 和 高 通 滤波 器 组 成 的 一 棵 
树 。 原 始 信号 经 过 一 对 互补 的 滤波 器 组 进行 的 分 解 称 为 一 级 分 解 ， 信 号 的 分 解 过 程 也 可 以 不 
断 进行 下 去 ， 也 就 是 说 可 以 进行 多 级 分 解 。 如 果 对 信号 的 高 频 分 量 不 再 分 解 ， 而 对 低频 分 量 
进行 连续 分 解 ， 就 可 以 得 到 信号 不 同 分 辩 率 下 的 低频 分 量 ， 这 也 称 为 信号 的 多 分 辩 率 分 析 。 
如 图 5-31 所 示 就 是 这 样 一 个 小 波 分 解 树 。 图 中 8 表示 原始 信号 ，4 表示 近似 分 量 ， 疡 表示 
细节 分 量 ， 下 标 表示 分 解 的 导数。 由 于 分 析 过 程 是 重复 迭代 的 ， 从 理论 上 讲 可 以 无 限 地 连续 
分 解 下 去 ， 但 事实 上 ， 分 解 可 以 进行 到 细节 只 包含 单个 样本 为 止 。 实 际 中 ， 分 解 的 级 数 取决 
于 要 分 析 的 信号 数据 特征 及 用 户 的 具体 需要 。 

对 于 一 个 信号 采用 如 图 5-30 所 示 的 方法 ， 理 论 上 将 产生 两 倍 于 原始 数据 的 数据 量 。 为 
此 ， 根 据 奈奈 斯 特 采样 定理 ， 采 用 下 采样 的 方法 来 减少 数据 量 ， 即 在 每 个 通道 内 〈 低 通 和 高 
通通 道 )， 每 两 个 样本 数据 取 一 个 ， 通 过 计算 得 到 离散 小 波 变换 系数 ， 从 而 得 到 原始 信号 的 
近似 分 量 与 细节 分 量 。 

3 逆 离散 小 波 变换 〈 小 波 重 构 ) 

将 信号 的 小 波 分 解 的 分 量 进 行 处 理 后， 一般 还 要 根据 需要 把 信号 恢复 出 来 ， 也 就 是 利用 
信号 的 小 波 分 解 的 系数 还 原 出 原始 信号 ， 这 一 过 程 称 为 着 离散 小 波 变换 ， 也 常常 称 为 小 波 重 
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。 构 。 小 波 分 解 包括 滤波 与 下 采样 ， 小 波 重 构 过 程 则 包括 上 采样 与 涉 波 。 上 采样 的 过 程 是 在 两 个 样 
本 之 间 插 入 0。 由 图 5-31 可 知 ， 小 波 重 构 过 程 为 4 + 忆 = 省 ; 少 + 记 =4; 4+ 刀 =S。 





























图 5-30 小 波 分 解 示 意图 图 5-31 小 波 分 解 树 


4. 小 波 包 分 析 
在 小 波 分 解 中 ， 一 个 信号 可 以 不 断 分 解 为 近似 分 量 和 细节 分 量 ， 近 似 分 量 可 以 继续 分 
解 ， 但 是 细节 分 量 不 能 分 解 ， 为 此 ， 人 们 又 提出 了 对 分 量 的 小 波 包 分 解 。 使 用 小 波 包 分 解 ， 
不 但 可 以 不 断 分 解 近似 分 量 ， 也 可 以 继续 分 解 细节 分 量 ， 从 而 使 整个 分 解构 成 一 种 二 叉 树 结 
构 ， 如 图 5-32 所 示 。 
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图 5-32 小波 包 分 解 示意 图 













































































5. 二 维 离散 小 波 变换 

二 维 离散 小 波 变换 是 一 维 离散 小 波 变换 的 推广 ， 其 实质 是 将 二 维 信号 在 不 同 尺度 上 的 分 
解 。 得 到 原始 信号 的 近似 分 量 和 细节 分 量 。 由 于 信号 是 二 维 的 ， 因 此 分 解 也 是 二 维 的 。 分 解 
结果 是 : 近似 分 量 4 、 水 平 细 节 分 量 瓦 、 垂 直 细节 分 量 挛 和 对 角 细 节 分 量 盖 。 同 样 也 可 以 
利用 二 维 小 波 分 解 的 结果 在 不 同 尺 度 上 重 构 信号 。 


ES 小 波 变 换 在 图 像 处 理 方面 的 应 用 及 实现 | 


1. 小 波 变换 在 图 像 处 理 的 应 用 

小 波 变换 是 一 种 复杂 的 数学 变换 ， 可 以 在 时 域 和 频 域 上 对 原始 信号 进行 多 分 辩 率 分 解 ， 
小 波 变换 的 应 用 是 与 小 波 变换 的 理论 研究 紧密 结合 在 一 起 的 。 小 波 变换 在 图 像 处 理 方面 的 应 
用 十 分 广泛 ， 可 用 于 图 像 压 缩 、 分 类 识别 、 去 除 噪 声 等 ， 在 医学 成 像 方面 ， 它 用 于 减少 B 
超 、CT、 核 磁 共振 成 像 的 时 间 ， 提 高 分 辨 率 等 。 

小 波 变换 用 于 信号 与 图 像 压 缩 ， 是 小 波 变换 应 用 的 一 个 重要 方面 。 它 的 特点 是 压缩 比 
高 ， 压 缩 速度 快 ， 压 缩 后 能 保持 信号 与 图 像 的 特征 不 变 ， 且 在 传递 中 可 以 抗 干扰 。 基 于 小 波 
变换 的 压缩 方法 很 多 ， 比 较 成 功 的 有 小 波 包 最 优 基 方 法 、 小 波 域 纹理 模型 方法 、 小 波 变换 零 
树 压缩 、 小 波 变换 向 量 压 缩 等 。 下 面 举 一 个 二 级 小 波 分 解 的 例子 来 说 明基 于 小 波 变换 的 图 像 














编码 能 够 很 好 地 实现 图 像 分 辨 率 和 图 像 质 量 的 多 级 伸缩 性 。 
如 图 5-33a 所 示 是 一 -个 分 辩 率 为 256 像素 x256 像素 的 灰 度 图 像 ， 图 像 的 灰 度 级 为 256， 

对 这 个 二 维 原始 图 像 进行 小 波 变换 ， 实 际 上 就 是 把 原始 图 像 的 像素 值 矩阵 变换 成 另 一 个 有 利 
于 压缩 编码 的 系数 矩阵 。 该 系数 矩阵 所 对 应 的 图 像 如 图 5-33b 所 示 ， 可 以 看 出 ， 经 过 一 级 小 
波 变换 后 ， 原 始 图 像 被 分 解 成 几 个 子 图 像 ， 每 个 子 图 像 包 含 了 原始 图 像 中 不 同 的 频率 成 分 
左上 角子 图 包含 了 图 像 的 低频 分 量 ， 即 图 像 的 主要 特征 ， 低 频 分 量 可 再 次 分 解 ， 右 上 角子 图 
像 包 含 了 图 像 的 垂直 分 量 ， 即 包含 了 较 多 的 垂直 边缘 信息 ; 左下 角子 图 像 包 含 了 图 像 的 水 平 
分 量 ， 即 包含 了 较 多 的 水 平 边缘 信息 ; 右 下 角子 图 像 包 含 了 图 像 的 对 角 分 量 ， 即 同时 包含 了 
垂直 和 水 平 边缘 信息 。 从 图 5-33b 中 可 以 看 出 ， 经 过 小 波 变换 ， 原 始 图 像 的 全 部 信息 被 重新 
分 配 到 了 4 个 子 图 中 。 左 上 角子 图 像 包 含 了 原始 图 像 的 低频 信息 ， 但 失去 了 一 部 分 边沿 细节 
信息 ， 这 些 失 去 的 细节 信息 被 分 配 到 其 他 3 个 子 图 像 中 。 由 于 失去 了 部 分 细节 信息 ， 所 以 左 
上 角子 图 像 比 原始 图 像 模 糊 了 一 些 ， 不 仅 如 此 ， 其 长 宽 尺 寸 也 降低 到 原来 的 一 半 ， 即 分 辨 率 
降低 到 原来 的 4。 一 种 最 容易 理解 的 图 像 压缩 方法 就 是 ， 丢 弃 3 个 细节 子 图 像 ， 只 保留 并 
编码 低频 子 图 像 。 但 实际 上 ， 并 不 是 通过 这 么 简单 的 处 理 来 进行 图 像 压缩 ，3 个 细节 子 图 像 
不 会 被 丢掉 ， 而 是 与 低频 子 图 像 一 起 编 入 码 流 ， 这 样 才 可 能 在 解码 时 恢复 出 完整 的 原始 图 
像 。 当 然 ， 如 果 用 户 只 需要 一 个 小 尺寸 的 图 像 ， 那 就 只 需 从 码 流 中 解码 出 低频 子 图 像 即 可 
低频 子 图 像 可 以 进一步 分 解 ， 经 过 二 级 分 解 后 ， 系 数 矩 阵 所 对 应 的 图 像 如 图 5-33c 所 示 。 图 
5-33c 中 ， 低 频 子 图 像 的 尺寸 降 到 原始 图 像 的 116， 可 见 每 一 级 分 解 都 是 对 空间 分 辨 率 和 频 
率 分 量 的 进一步 细 分 。 从 此 例 可 以 看 出 ， 小 波 变换 为 在 一 个 码 流 中 实现 图 像 多 级 分 辩 率 提供 - 
了 基础 。 前 面 提 到 ， 为 了 能 在 解码 端 恢复 出 完整 的 原始 图 像 ， 所 有 的 细节 子 图 像 都 一 起 编 入 
了 码 流 ， 不 扔 掉 这 些 细节 ， 那 图 像 的 数据 量 又 怎 能 被 压缩 呢 ? 对 图 像 进行 了 小 波 变换 ， 并 不 
代表 图 像 的 数据 量 就 被 压缩 了 ， 因 为 变换 后 ， 系 数 的 总 量 并 未 减少 ， 那 么 变换 的 意义 何在 
呢 ? 其 意义 在 于 使 图 像 的 能 量 分 布 〈 频 域内 的 系数 分 布 ) 发 生 改变 ， 从 而 利于 压缩 编码 。 要 
真正 地 压缩 数据 量 ， 还 要 对 变换 后 的 系数 进行 量化 、 扫 描 和 箭 编码， 这样 就 可 以 达到 减少 图 
”| 像 数据 量 的 目的 。 
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图 5-33 ”二 级 小 波 变换 示例 
引 ) 原始 灰 度 图 像  b) 一 级 小 波 变换 后 的 图 像 ” e) 二 级 小 波 变换 后 的 图 像 


2， 小 波 变 换 的 MATLAB 实现 
利用 二 维 小 波 变换 对 图 像 编码 ， 如 图 5-34 所 示 为 运行 结果 ， 程 序 代码 如 下 ; 


<127 





clear; % 清 除 MATLAB 工作 环境 中 现 有 的 变量 
load wbarb; 。 % 装 入 图 像 
subplot(2,2,1):image(X):colormap(tmap); 
title( 原 始 图 像 ); 

disp(' 原 始 图 像 X 的 大 小 :7; 

whos(CX9; 

% 对 图 像 用 bior3.7 小 波 进行 二 层 小 波 分 解 
[csj=-wavedec2(X,2,bior3.77; 

% 提 取 小 波 分 解 结 构 中 第 一 层 的 低频 系数 和 高 频 系数 
cal=appcoef2(csrbior3.7,1); 

chl=detcoefP2(h,cs,1); 
cvl=detcoef2(V,cis， 
edl=detcoef2(dve,s,1); 

% 分 别 对 各 频率 成 分 进行 重 构 

al=wrcoefP2(atcvsybior3.7,1); 

hl=wrcoef2(h,c,sybior3.7,1); 

V1=wrcoef2(v,csybior3.7,1); 

dl=wrcoef2(Cd'cisvbior3.7,1); 

cl=[alhl;vldl]; 

%% 显 示 分 解 后 各 频率 分 量 的 信息 

subplot(2,2,.2);image(c1); 

axis square; 

title( 分 解 后 低频 和 高 频 信 息 ); 

% 下 面 进行 图 像 压缩 处 理 

%% 保 留 小 波 分 解 第 一 层 低频 信息 ， 进 行 图 像 的 压缩 

% 第 一 层 的 低频 信息 即 cal ， 显 示 第 一 层 的 低频 信息 

% 首 先 对 第 一 层 信息 进行 量化 编码 

cal=appcoef2(csybior3.7,1); 

cal=wcodemattcal,440,mat,0); 

% 改 变 图 像 的 高 度 

cal=0.5ycali 

subplot(2,2,.3):image(cal);colormap(tmap); 

axis square; 

title( 第 一 次 压缩 图 像 ); 

disp( 第 一 次 压缩 图 像 的 大 小 :7; 

whos(caly; 

% 保留 小 波 分 析 分 解 第 二 层 低频 信息 ， 进 行 图 像 的 压缩 ， 此 时 压缩 比 更 大 
% 第 二 层 的 低频 信息 ca2， 显 示 第 二 层 的 低频 信息 
ca2=appcoef2(csybior3.7.2); 

ca2=wcodemattca2,440,mat,0); 

ca2=0.25*ca2; 

subplot(2,2,4):image(ca2):colormap(map); 

axis square; 

title(' 第 二 次 压缩 图 像 ); 

disp( 第 二 次 压缩 图 像 的 大 小 :7; 

whos(ca2); 
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图 5-34 ”示例 运行 结果 


原始 图 像 X 的 大 小 : 
Name Size Bytes Class 
X 256x256 524288 double array 


Grand total is 65536 elements using 524288 bytes 
第 一 次 压缩 图 像 的 大 小 : 


Name Size Bytes Class 
cal 135x135 145800 double array 
Grand total is 18225 elements using 145800 bytes 


第 二 次 压缩 图 像 的 大 小 : 


Name Size Bytes ”Class 
ca2 75x75 45000 double array 
Grand total is 5625 elements using 45000 bytes 


5.7 ” 扁 形 光束 投影 


类 似 于 Radon 变换 ， 扇 形 光束 投影 (Fan- 
Beam Projection) 也 是 通过 求 沿 一 组 特定 方向 的 
直线 积分 来 获得 图 像 的 映射 ， 如 对 于 一 幅 图 像 ， 
就 是 求 一 组 扇形 直线 的 线 积分 ， 而 这 组 扇形 直线 
是 由 一 个 点 源 发 散 形成 一 个 扇形 而 得 名 。 为 了 获 
得 图 像 的 有 效 投影 ， 可 以 改变 点 源 的 方向 角 ， 得 
到 一 组 映射 ， 如 图 5-35 所 示 。 

MATLAB 提供 了 fanbeam(0) 函 数 来 实现 扇形 
光束 投影 的 功能 ， 下 面 分 别 介绍 如 何 使 用 该 函数 投影 中 心 
获得 映射 数据 以 及 从 映射 数据 重建 原 图 像 ， 最 后 本 < 要 及 








给 出 





一 个 例子 来 详细 说 明 。 


国 投影 变换 的 基本 概念 


通用 fanbeam() 函 数 实现 图 像 映 射 ， 必 须 给 定 一 些 参数 ， 如 图 像 ， 扇 形 光 束 的 原点 以 及 


旋转 中 心 〔 即 图 像 中 心 像素 )， 投 影 线 的 数量 由 fanbeam() 函 数 根据 图 像 的 大 小 以 及 以 上 给 定 
的 每 隔 一 个 弧度 〈Arc) 分 配 一 条 投影 线 ， 如 图 5-36 所 示 。 

如 果 将 几何 关系 设 定 为 “线形 ” 则 其 几何 示意 图 如 图 5-37 所 示 。 
在 获得 图 像 的 投影 数据 后 ， 可 以 调用 ifanbeam( ) 函 数 来 重建 图 像 。 


用 度 表示 的 间隔 


接收 器 


接收 器 几何 一 “arc' ) 


ifanbeam(P, D); 






图 5-36 弧度 光束 投影 原理 图 


E85 投影 变换 函数 的 应 用 | 


下 面 以 一 个 实例 来 说 明 映 射 和 重建 的 过 程 。 


% 产 生 测试 图 像 并 显示 
P=phantom(256); 
figure,imshow(P); 


% 计 算 投 影 数据 


接收 器 几何 ='line' 






用 度 表示 的 间隔 


汉 2 遍 形 旋转 角 


中 心 像素 


投影 中 必 


图 5-37 ”线性 光束 投影 原理 图 


% 设 定 几何 关系 为 “线形 ”， 分 别 给 定 光束 数目 为 18，36 和 90 


[R1xp]=radon(P,thetal); 


num_angles_R1=size(R1.2) % num_angles_R1-18 


theta2=-0:5:175; 
[R2,xp]=radon(P,theta2); 


num_angles_R1=size(R2,2) 9% num_angles_R1-36 


theta3=-0:2:178; 








[R3,xp]=radon(P,theta3); 
num_angles_R1=-size(R3,2) 9 num_angles_R1=90 
% 设 定 几何 关系 为 “弧度 ”， 分 别 给 定 光束 密度 为 2 弧度 、1 弧度 以 及 0. 25 弧度 


D=250; 

dsensorl=2; 人 
F1=fanbeam(P,D,FanSensorSpacing,dsensorl); 

dsensor2=1; 

F2= 人 anbeam(P,D,FanSensorSpacing'dsensor2); 

dsensor3=0.25; 
[F3,sensor_pos3,fan_rot_angles3]=fanbeam(P,D,FanSensorSpacing'dsensor3); 
% 显 示 投 影 数据 

% 几 何 关系 为 “线形 ” 

figure,imagesc(theta3,xp,R3) 

colormap(hob) 

colorbar 

xlabel(Parallel Rotation Angle-vtheta(degrees)7; 

ylabel(Parallel Sensor Position-xVprime(pixels)y; 

% 几 何 关 系 为 弧度 

figure,imagesc(fan_rot_angles3,sensor_pos3,F3) 

colormap(hob:colorbar 

xlabel(Fan Rotation Angle(degrees)); 

ylabel(Fan Sensor Position(degrees)); 

% 重 建 图 像 

% 几 何 关系 为 “线形 ” 

output_size=max(size(P)); 
dthetal=thetal(2)-thetal(1); 

Il=Iradon(Rl,dthetal,output_size); 

figureiimshow(ID) 

dtheta2=theta2(2)-theta2(1); 

12=Iradon(R2,dtheta2,output_size); 

figure,imshow(I2) 

dtheta3=theta3(2)~theta3(1); 

13=Iradon(R3,dtheta3,output_size); 

figure,imshow(3) 

% 几 何 关系 为 “弧度 ” 

Ifan1=Ifanbeam(F1,D,FanSensorSpacing',dsensorl,OutputSizevoutput_sizej; 

figure,imshow(Ifanl) 
Ifan2=[Ifanbeam(F2,D,FanSensorSpacing'dsensor2,OutputSize,outp 
ut_size); 

figure,imshow(lfan2) 
Ifan3=Ifanbeam(F3,D,FanSensorSpacing',dsensor3,OutputSizevoutp 
ut_sizej; 

figure,imshow(Ifan3) 





图 5-38 为 由 函数 phantom() 产 生 的 原始 图 像 ， 图 5-39 为 生 洒 
成 的 投影 数据 ， 图 5-40 给 出 了 不 同 投影 密度 重建 的 图 像 。 国 538 7 生 时 锥 国 你 
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a 儿 何 线形 ” b 几何 





比较 图 5-40 的 a~e 三 幅 图 像 ， 可 以 看 到 I、LI 和 H3 都 不 同 程度 存在 虚假 点 ， 这 三 幅 
图 像 中 B 的 效果 最 好 。 比 较 图 5-40d~f 三 幅 图 像 ， 可 以 看 到 Ifan1、Ifan2 和 Ifan3 都 不 同 程 


度 地 存在 模糊 现象 ，Ifan3 的 重建 效果 最 好 ， 而 Ifanl 模糊 比较 严重 。 图 像 重建 中 存在 虚假 点 






























和 模糊 现象 都 与 用 于 图 像 重建 的 投 束 的 数目 有 关 ， 投 影 光 ， 图 像 重 建 时 就 能 更 好 
地 体现 图 人 细节 ， 而 且 避 免 出 现 虚假 点 。 显 然 ， 用 RI1 和 F1 重建 图 像 的 投影 光束 太 少 ， 得 
到 的 重建 结果 明显 比 原 始 图 像 差 很 多 。 因 此 ， 为 了 获得 高 质量 的 重建 结果 ， 高 重建 图 
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图 像 频 域 变换 





5-1 离散 傅 里 叶 变换 的 性 质 及 在 图 像 处 理 中 的 应 用 有 哪些 ? 
5-2 求 如 图 5$-41 所 示 图 像 的 二 维 离散 傅 里 叶 变换 。 
O@ 长 方形 图 像 


二 
人 攻 其 他 


@@ 旋转 45” 后 的 长 方形 图 像 。 
5-3 构造 W =8 的 Haar 变换 矩阵 。 
5-4 请 用 C 语言 或 者 MATLAB 编程 做 出 如 图 5-42 所 示 图 像 的 二 维 离散 余弦 变换 。 


64X64 4X64 




















图 5-41 图 5-42 


5-5 编写 一 个 程序 ， 要 求实 现下 列 算法 : 首先 将 图 像 分 割 为 8x8 的 子 图 像 ， 对 每 个 子 
图 像 进行 FFT， 对 每 个 子 图 像 中 的 64 个 系数 ， 按 照 每 个 系数 的 方差 来 排序 后 ， 仿 去 小 的 变 
换 系 数 ， 只 保留 16 个 系数 ， 实 现 4 : 

5-6 离散 哈达 玛 变换 的 最 大 优点 是 什么 ? 

5-7 K-L 变换 的 优点 是 什么 ? K-L 变换 都 有 哪些 性 质 ? 

5-8 求 下 面 离散 图 像 矩阵 的 二 维 离散 傅 里 叶 变换 、 离 散 沃 尔 什 变换 和 离散 哈达 玛 变换 。 

0 








0 
0 
0 
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ww ww 


有 
3 
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5-9 给 定 一 幅 行 和 列 都 为 2 的 整数 次 守 图 像 ， 用 Haar 小 波 基 函数 对 其 进行 二 维 小 波 变 
换 ， 试 着 将 最 低 尺 度 近似 分 量 瑟 置 零 再 反 变换 ， 结 果 是 什么 ?如 果 把 垂直 方向 的 细节 分 量 


置 零 ， 反 变换 后 结果 又 是 什么 呢 ? 试 解释 一 下 原因 。 
5-10 小 波 变换 是 如 何 定义 的 ? 小 波 分 析 的 主要 优点 是 什么 ? 





第 6 章 图 像 处 理 中 的 代数 运算 及 几何 变换 


图 像 处 理 是 建立 在 各 种 算法 基础 上 的 处 理 方法 ， 本 章 围绕 数字 图 像 处 理 中 的 基本 运算 ， 
主要 介绍 图 像 处 理 中 的 点 运算 、 代 数 运算 和 几何 变换 ， 及 其 在 图 像 处 理 中 的 应 用 等 。 


6.1 基本 运算 类 型 


在 数字 图 像 处 理 中 ， 经 常 需要 采用 各 种 各 样 的 算法 ， 根 据 数字 图 像 处 理 运算 中 输入 信息 
与 输出 信息 的 类 型 ， 具 有 代表 性 的 图 像 处 理 典型 算法 从 功能 上 包括 以 下 几 种 : 

1) 单 幅 图 像 一 单 幅 图 像 。 

2) 多 幅 图 像 一 单 幅 图 像 。 

3) 单 幅 图 像 或 多 幅 图 像 一 数值 /符号 等 。 

以 上 三 类 运算 形式 中 ， 所 有 输入 信息 都 是 图 像 且 其 灰 度 值 都 是 非 负 整数 值 ， 而 输出 信息 
的 形式 则 各 不 相同 ， 既 可 以 是 具有 非 负 灰 度 值 的 数字 图 像 ， 又 可 以 是 仅 具有 0、1 两 个 灰 度 
值 的 二 值 图 像 ， 也 可 以 是 对 输入 图 像 逐 个 像素 点 进行 解释 的 符号 或 由 特定 参数 组 成 的 某 种 二 
维 信息 〈 又 称 为 标号 图 像 )， 还 可 以 是 从 图 像 中 提取 出 的 以 数值 或 符号 描述 的 特征 信息 。 所 
有 以 二 维 信息 形式 输出 的 信息 统称 为 广义 图 像 ， 标 号 图 像 也 属于 广义 图 像 的 范畴 。 

在 三 类 运算 中 ， 第 一 类 运算 功能 是 数字 图 像 处 理 技术 中 最 基本 的 功能 。 对 基本 的 图 像 处 
理 功 能 ， 根 据 和 输入 图 像 得 到 输出 图 像 〈 目 标 图 像 》 处 理 运算 的 数学 特征 ， 可 将 图 像 处 理 运算 
方式 分 为 点 运算 、 代 数 运算 和 几何 运算 。 这 些 运算 都 是 基于 空间 域 的 图 像 处 理 运算 ， 与 空间 
域 运算 相对 应 的 是 变换 域 运算 。 


6.2 点 运算 


在 图 像 处 理 运算 中 ， 点 运算 〈Point Operation) 是 一 类 简单 却 非常 具有 代表 性 的 重要 算法 
之 一 ， 也 是 其 他 图 像 处 理 运算 的 基础 。 运 用 点 运算 可 以 改变 图 像 数 据 所 占据 的 灰 度 值 范围 。 对 
于 一 幅 输 入 图 像 ， 经 过 点 运算 会 产生 一 幅 输出 图 像 ， 输 出 图 像 中 每 个 像素 点 的 灰 度 值 仅 由 相应 
输入 像素 点 的 灰 度 值 确定 。 这 与 领域 处 理 算法 截然 不 同 ， 在 领域 处 理 算法 中 ， 每 个 输出 像素 的 
灰 度 值 由 对 应 输入 像素 的 一 个 领域 内 若干 像素 点 的 灰 度 值 共同 决定 。 因 此 ， 点 运算 不 会 改变 图 
像 内 的 空间 位 置 关系 。 点 运算 是 图 像 数字 化 软件 以 及 图 像 显 示 软 件 的 重要 组 成 部 分 。 


E9I 点 运算 的 种 类 | 


点 运算 从 数学 上 可 以 分 为 线性 点 运算 和 非 线 性 点 运算 两 类 。 
1. 线性 点 运算 
线性 点 运算 是 指 输入 图 像 的 灰 度 级 与 目标 图 像 的 灰 度 级 呈 线 性 关系 。 线 性 点 运算 的 灰 度 


























变换 函数 形式 可 以 采用 线性 方程 描述 ， 即 
De =aD,+D (6-1) 
式 中 ，D, 为 输入 点 的 灰 度 值 ， Ds 为 相应 输出 点 的 灰 度 值 。 这 种 线性 运算 关系 如 图 6-1 





2， 非 线性 点 运算 训 
除了 线性 点 运算 外 ， 还 有 非 线性 点 运算 。 一 般 考虑 非 减 (Nondecreasing) 的 灰 度 变换 函 

数 ， 其 灰 度 变换 关系 如 图 6-2 所 示 。 非 线性 点 运算 的 灰 度 变换 函数 的 斜率 处 处 为 正 数 ， 这 类 

函数 保留 了 图 像 的 基本 外 瑶 。 
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图 6-1 线性 点 运算 图 6-2 ” 非 线性 点 运算 


非 线性 点 运算 的 函数 形式 可 以 表示 为 
Des=jJCD) (6-2) 
式 中 ， 了 ,为 输入 点 的 灰 度 值 ; Ds 为 相应 输出 点 的 灰 度 值 ， 三 表示 非 线性 函数 ， 函 数 表达 式 
须根 据 具体 应 用 选择 有 代表 性 的 非 线 性 函数 形式 。 
以 下 是 三 种 典型 的 非 线 性 点 运算 函数 。 
De =JD)=Di+CD(D, -DJ) (6-3) 
式 中 ， 也 , 为 灰 度 级 的 最 大 值 ， 参数 C 定义 了 中 间 灰 度 范围 内 的 增加 量 (C >0) 或 减少 量 
(C<0)。 非 线性 点 运算 可 增加 中 间 范 围 像素 的 灰 度 级 而 只 使 暗 像素 和 亮 像素 进行 较 小 改变 。 


7FDD= 色 Ji 一 上 sim 至 -os<asi (6-4) 
2 il 至 妈 
SID 了 


式 中 ， 灰 度 级 范围 为 0~ Du ， 在 该 灰 度 级 范围 内 ， 直 方 图 非 零 。 参 数 w 越 大 ， 效 果 越 明显 。 
该 函数 是 基于 正弦 函数 的 非 线性 点 运算 形式 。 这 类 非 线性 单调 点 运算 通过 降低 较 高 或 较 暗 物 
体 的 对 比 度 来 加 强 灰 度 级 处 于 中 间 范 围 的 物体 的 对 比 度 ， 这 类 函数 曲线 为 形 ， 其 灰 度 变换 
函数 在 中 间 部 分 的 斜率 大 于 1， 而 两 端 处 斜率 小 于 1。 


tan| ar 作 本 0<a<1 (6-5) 
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该 函数 是 基于 正切 函数 的 非 线性 点 运算 形式 。 同 样 ， 参 数 a 决定 点 运算 的 效果 。 这 类 非 
线性 单调 点 运算 是 通过 降低 灰 度 级 处 于 中 间 范 围 的 物体 的 对 比 度 ， 而 将 较 亮 和 较 暗 物体 的 对 
比 度 加 强 。 该 灰 度 变换 函数 在 中 间 处 的 斜率 小 于 1， 而 在 靠近 两 端 处 斜率 大 于 1。 


2 
点 运算 是 一 种 在 确定 的 函数 关系 下 所 进行 的 像素 变换 运算 ， 因 此 ， 点 运算 之 后 输出 图 像 
和 输入 图 像 之 间 的 直方 图 也 具有 与 变换 函数 相关 联 的 对 应 关系 。 

设 点 运算 之 间 的 函数 关系 为 De = /CD4) ， 输 入 直方 图 、 灰 度 变换 函数 以 及 输出 直方 图 
之 间 的 关系 如 图 6-3 所 示 。 灰 度 值 D, 转换 为 pp ， 同 样 ， 灰 度 值 D,+AD, 转换 为 
有 +ADs ， 且 在 灰 度 级 [Di,D4+AD4] 之 间 的 所 有 像素 被 转化 到 灰 度 级 [De,De +ADs] 之 
间 ， 进 一 步 可 得 出 ， 灰 度 级 [Di,D4+ADi] 之 间 的 输入 像素 的 个 数 等 于 灰 度 级 [Ds， 
De+ADs] 之 间 的 输出 像素 的 个 数 ， 即 


和 人 下 DJ 1 





Di+ADy 
五 ep(D)dD (6-6) 
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图 6-3 点 运算 与 直方 图 之 间 的 关系 


当 AD, 很 小 时 ，ADs 的 取 值 也 较 小 ， 因 此 ， 输 入 、 输 出 图 像 阴影 部 分 的 面积 可 分 别 用 

两 个 小 矩形 的 面积 近似 替代 。 
es(Ds)ADs = 万 4(D4)AD， (6-7) 

因此 ， 输 出 直方 图 的 值 为 


已 (CD) 
ADa/AD， 


万 (Da) = 万 ,(D,)AD,/AD。 = (6-8) 


若 AD, 趋 于 0， 则 取 极 限 ， 因 而 可 用 微分 表示 : 








瑟 ,(D 

画 (D)= 到 2 

二 

dD， 

代入 点 运算 的 函数 形式 得 如 下 结论 : 

ae(Dp)= 3 (6-10) 
dD， 





点 运算 的 应 用 








算 能 


有 规律 地 改变 像素 点 的 灰 度 值 ， 因 而 点 运算 有 时 又 被 称 为 对 比 度 增强 或 灰 





度 变换 〈Gray-Scale Transformation，GST)。 因 此 ， 通 过 恰当 定义 数学 运算 的 形式 ， 点 运算 
可 用 于 改善 图 像 数 字 化 设备 或 图 像 数字 显示 设备 的 某 些 局 限 性 。 

1 对比 度 增 强 

在 一 些 数字 图 像 中 ， 技 术 人 员 所 关注 的 特征 可 能 仅 占 整 个 灰 度 级 范围 非常 小 的 一 部 分 。 


点 运算 可 以 扩展 所 


关注 部 分 的 灰 度 信息 的 对 比 度 ， 使 其 占据 可 显示 灰 度 级 的 更 大 部 分 。 该 方 


法 有 时 被 称 为 对 比 度 增强 〈Contrast Enhancement) 或 对 比 度 拉 伸 〈Contranst Stretching)。 


2. 光度 学 标定 


人 们 常常 希望 





数字 图 像 的 灰 度 能 反映 诸如 光照 强度 、 光 密度 等 某 些 物理 特性 ， 通 过 去 掉 


图 像 传感器 的 非 线性 影响 ， 点 运算 可 达到 该 目的 。 例 如 ， 假 设 一 幅 图 像 被 一 个 对 光照 强度 时 
非 线性 关系 的 仪器 所 数字 化 ， 点 运算 可 以 通过 适当 的 灰 度 变换 运算 ， 使 灰 度 级 与 光照 强度 的 


等 步 长 增 量 匹配 。 
点 运算 的 另 
显微镜 下 观察 到 的 
幅 图 像 ， 该 图 像 的 
软件 部 分 。 
3. 显示 标定 
一 些 显示 设备 
数字 图 像 中 具有 相 


-个 用 处 是 变换 灰 度 的 单位 。 假 定 有 一 个 图 像 数字 化 仪器 ， 用 来 数字 化 一 幅 


图 像 。 其 产生 的 灰 度 值 与 标本 的 透射 率 呈 线性 关系 ， 点 运 
灰 度 级 可 代表 光学 密度 的 等 步 长 增 量 。 光 度 学 标定 通常 


算 可 用 来 产生 一 
作为 图 像 数字 化 的 











通常 具有 能 突出 图 像 视觉 特征 的 优选 灰 度 范围 。 使 用 这 样 的 显示 设备 时 ， 
司 对 比 度 的 较 暗 和 较 亮 的 特征 ， 在 显示 时 却 不 能 以 同样 的 性 能 表现 出 来 。 


在 这 种 情况 下 ， 用 户 可 以 利用 点 运算 让 感 兴趣 的 所 有 特征 同等 突出 地 显示 出 来 。 


一 些 显示 设备 
关系 ， 同 样 ， 许 多 
算 予 以 克服 ， 即 在 


性 组 合 起 来 互相 抵消 ， 以 保持 在 显示 图 像 时 的 线性 关系 。 这 : 


Calibration ) 。 
少数 情况 下 ， 


不 能 保持 数字 图 像 上 像素 的 灰 度 值 和 显示 屏幕 上 相应 点 的 亮度 之 间 的 线性 
六 片 记录 仪 不 能 线性 地 将 灰 度 值 转换 为 光 密 度 。 这 一 缺点 也 可 以 通过 点 运 
算 和 显示 非 线 
一 过 程 就 是 显示 标定 〈Display 











图 像 显 示 之 前 ， 先 设计 合理 的 点 运算 关系 。 另 外 ， 可 将 上 








上 线性 显示 关系 对 于 图 像 的 表示 也 具有 一 定 的 作用 。 例 如 ， 电 视 机 或 CRT 


是 利用 了 这 种 非 线性 关系 ， 点 运算 可 纠正 或 调整 显示 的 值 。 








点 运算 有 时 被 视 为 强化 细节 或 增加 图 像 某 些 部 分 的 对 比 度 的 图 像 处 理 步骤 。 然 而 ， 由 于 
信息 实际 上 包含 在 数字 图 像 中 ， 所 以 ， 实 际 要 做 的 工作 是 使 感 兴趣 部 分 的 灰 度 级 与 显示 设备 
的 对 比 度 范围 匹配 起 来 。 显 示 标定 和 对 比 度 增 强 也 经 常 作 为 数字 图 像 显示 的 软件 部 分 。 

4. 轮廓 线 

点 运算 可 为 图 像 加 上 轮廓 线 。 可 以 应 用 点 运算 进行 阔 值 化 ， 根 据 灰 度 级 可 将 一 幅 图 像 划 
分 成 一 些 不 连接 的 区 域 ， 有 助 于 在 后 续 处 理 中 确定 边界 或 用 于 定义 掩 膜 。 


5. 葛 裁 
为 数字 图 像 通常 以 整 型 格式 存储 ， 所 以 ， 可 用 的 灰 度 级 范围 是 有 限 的 。 对 于 gbit 图 
像 ， 在 每 个 像素 值 被 存储 之 前 ， 输 出 灰 度 级 一 定 要 被 裁 前 到 0 一 255 的 范围 内 


6.3 图 像 的 代数 运算 


图 像 的 代数 运算 是 指 对 两 幅 或 两 幅 以 上 输入 图 像 的 对 应 像素 逐个 进行 加 、 减 、 乘 、 除 四 
则 运算 ， 以 产生 有 增强 效果 的 图 像 。 图 像 的 代数 运算 是 一 种 比较 简单 和 有 效 的 增强 处 理 ， 是 
图 像 增 强 处 理 中 的 常用 方法 。 为 此 ，MATLAB 7.0 的 图 像 处 理工 具 箱 提供 了 一 套图 像 代数 运 
算 函 数 ， 使 得 对 图 像 的 代数 运算 变 得 非常 容易 。 

图 像 代数 运 算 函 数 可 以 处 理 包括 uint8g、uint16 和 double 等 各 种 类 型 在 内 的 数值 数据 ， 
并 返回 相同 类 型 的 结果 图 像 。 


6.31 
图 像 数据 不 同 于 一 般 意义 的 数据 ， 在 执行 代数 运算 得 到 结果 图 像 的 时 候 ， 必 须 注意 图 像 
数据 的 物理 意义 ， 保 证 计算 结果 的 合理 性 。 和 否则， 在 执行 图 像 代数 运算 时 ， 结 果 经 常会 出 现 
一 些 异 常情 况 。 常 见 的 异常 情况 有 以 下 两 种 。 
(1) 计算 结果 溢出 
很 多 图 像 ， 如 灰 度 图 像 、 索 引 色 图 像 、 二 值 图 像 或 有 限 位 真 彩色 图 像 ， 其 像素 值 是 有 范 
围 限 制 的 ， 然 而 在 执行 两 幅 或 多 幅 图 像 的 如、 减 或 乘法 运算 时 ， 计 算 结 果 很 可 能 会 超出 限定 
的 有 效 范围 ， 如 两 幅 256 色 灰 度 图 像 在 执行 减法 运算 时 ， 很 可 能 会 出 现 像素 值 为 负 值 的 情 
况 。 或 者 执行 加 法 和 乘法 运算 时 ， 像 素 值 超过 255， 这 都 是 异常 的 结果 ， 必 须 改正 。 

(2) 计算 结果 类 型 无 效 

图 像 数据 有 多 种 存储 类 型 ， 如 uint8 或 uint16， 像 素 值 要求 是 整数 类 型 ， 然 而 在 进行 除 
法 运算 时 ， 往 往 会 得 到 分 数 的 计算 结果 ， 这 是 因为 图 像 代数 运算 作为 函数 在 执行 运算 时 ， 把 
图 像 数 据 看 为 double 类 型 。 这 是 另 一 种 异常 的 图 像 代 数 运算 结果 ， 也 必须 加 以 改正 。 

MATILAB 中 用 于 普通 代数 运算 的 操作 符 尽管 也 可 以 执行 加 、 减 、 乘 、 除 四 则 运算 ， 但 
它们 对 计算 结果 的 有 效 性 不 予 检查 ， 直 接 以 实数 运算 的 结果 进行 表示 。 然 而 ， 用 于 图 像 的 代 
数 运 算 函 数 则 会 自动 地 对 计算 结果 进行 有 效 修正 。 下 面 分 别 介绍 一 下 对 以 上 出 现 的 两 种 异常 
结果 的 修正 方式 。 

异常 计算 结果 的 修正 遵循 两 个 原则 ， 

1) 超过 整数 类 型 有 效 范围 的 结果 直接 截断 到 限定 范围 的 端点 值 。 





轩 











2) 对 于 分 数 计算 结果 采取 四 舍 五 入 。 
例如 ， 如 果 被 处 理 的 图 像 数 据 是 uint8 类 型 的 ， 当 计算 结果 出 现 以 下 情况 时 的 修正 结果 
见 表 6-1。 


表 6-1 像素 值 取 整 原则 等 修正 举例 











理论 计算 结果 函数 返回 值 类 型 实际 输出 结果 
300 uintg 255 
-30 uint8 0 
10.5 uints 1 








类 似 于 一 般 的 四 则 运算 ， 我 们 可 以 棋 套 使 用 图 像 代数 运算 函数 ， 即 组 合 多 个 图 像 代 数 运算 
函数 来 完成 一 系列 操作 。 例 如 ， 要 计算 两 幅 图 像 的 平均 值 ， 用 户 通常 会 想到 下 面 的 几 行 代码 ; 


imread(rice .png)); 
ia 
K=imdivide(imadd(, I2), 2); 

上 面 的 前 两 条 语句 是 分 别 读 取 图 像 rice.png 和 图 像 cameramantif 到 变量 I 和 I2， 第 三 条 
语句 是 组 合 使 用 加 法 函数 imadd0 和 除法 函数 imdivide0， 分 析 起 来 ， 这 样 的 代码 完全 可 以 完 
成 预定 的 操作 。 然 而 ， 当 我 们 读 进来 的 图 像 数据 是 uint8 或 uint16 类 型 时 ， 图 像 代 数 运算 函 
数 会 自动 地 按照 上 面 介绍 的 两 个 原则 对 结果 进行 修正 ， 而 且 MATILAB 图 像 代数 运算 函数 是 
每 执行 一 次 代数 运算 就 执行 一 次 修正 ， 这 样 对 于 第 三 条 语句 的 嵌 套 调用 则 是 先 对 加 法 运算 的 
结果 进行 修正 再 对 除法 运算 的 结果 进行 修正 ， 这 就 显著 地 减少 了 结果 图 像 中 包含 的 大 量 信 
息 。 为 了 能 够 得 到 更 好 的 结果 ， 在 嵌 套 调用 图 像 代数 运 算 函 数 时 ， 可 以 考虑 使 用 函数 
imlincomb0， 这 个 函数 采用 线性 组 合 的 方式 按照 double 类 型 执行 所 有 的 图 像 代 数 运算 函数 ， 
而 且 只 对 最 终结 果 进 行 数据 有 效 性 修正 。 为 此 ， 上 面 的 两 幅 图 像 求 平均 运算 ， 可 以 采用 如 下 
更 合适 的 语句 : 


K=imlincomb(. 5,1. S,I2); 





1. 加 法 运算 

图 像 加 法 运算 一 般 用 于 对 同一 场景 的 多 幅 图 像 求 平 均 效 果 ， 以 便 有 效 地 降低 具有 和 登 加 性 
质 的 随机 噪声 。 直 接 采 集 的 图 像 品质 一 般 都 较 好 不 需要 进行 加 法 运算 处 理 ， 但 是 对 于 那些 经 
过 长 距离 模拟 通信 方式 传送 的 图 像 〈 如 卫星 图 像 )， 这 种 处 理 是 必 不 可 少 的 。 

在 MATLAB 7.0 中 ， 如 果 要 进行 两 幅 图 像 的 加 法 ， 或 者 给 一 幅 图 像 加 上 一 个 常数 ， 可 
以 调用 imadd0) 函 数 来 实现 。imadd0) 函 数 将 某 一 输入 图 像 的 每 一 像素 值 与 另 一 幅 图 像 相 应 的 
像素 值 相 加 ， 返 回 相应 的 像素 值 之 和 作为 输出 图 像 的 对 应 像素 值 。imadd(O) 函 数 的 调用 格式 可 
参考 图 像 MATLAB 7. 0 处 理工 具 箱 。 下 面 的 程序 可 将 如 图 6-4a、b 所 示 的 图 像 登 加 在 一 起 
生成 新 图 像 ， 如 图 6-4c 所 示 。 














可 bb 日 





图 6-4 图 像 相 加 运算 


a 原始 图 像 rice.png 。b) 原始 图 像 cameramantif ”ce) 加 法 运算 后 的 图 像 


imread(rice.png); 
figure(D),imshow(LD) 
ID=imread(cameraman.tif) 
figure(2)imshow(l2,.[) 
K=imadd(L.I2,uint167); 
figure(3)imshow(K.D) 


给 图 像 的 每 一 个 像素 加 上 一 个 常数 可 以 使 图 像 的 整体 亮度 增加 。 例 如 ， 以 下 程序 实例 的 
处 理 效果 如 图 6-5 所 示 。 


Fimread(' Fimage \lena bmp)); 
ID=imadd(L.50); 
figure(l),imshow(D) 
figure(2),imshow(I2) 





可 上 
图 6-5 图 像 亮 度 整 体 增强 
a) 原始 图 像 Ienabmp 。 bj 加 入 常数 后 的 图 像 
对 两 幅 图 像 的 像素 值 进 行 相 加 操作 ， 其 结果 很 可 能 超过 图 像 数据 类 型 所 支持 的 最 大 值 ， 
尤其 对 于 uintg 类 型 的 图 像 ， 溢 出 情况 最 为 常见 。 当 数据 值 发 生 溢出 时 ，imadd() 函 数 会 将 数 
据 截 取 为 数据 类 型 所 支持 的 最 大 值 ， 这 种 截取 效果 称 为 饱和 处 理 。 为 了 避免 出 现 饱和 现象 ， 








在 进行 加 法 计算 前 最 好 将 图 像 转 换 为 一 种 数据 范围 较 宽 的 数据 类 型 。 例 如 ， 在 加 法 操作 前 将 
uintg8 类 型 的 图 像 转换 为 uint16 类 型 。 
减法 运算 

图 像 减法 也 称 为 差分 方法 ， 是 一 种 常用 于 检测 图 像 变 化 及 运动 物体 的 图 像 处 理 方法 。 图 
像 减 法 可 以 作为 许多 图 像 处 理 过 程 的 准备 步 又。 例如， 可 以 使 用 图 像 减 法 来 检测 一 系列 相同 
场景 图 像 的 差异 。 利 用 图 像 减 法 处 理 图 像 时 ， 往 往 需要 考虑 背景 的 更 新 机 制 ， 尽 量 补偿 因 天 
气 * 等 因素 对 图 像 显示 效果 造成 的 影响 。 

在 MATLAB 7.0 中 ， 使 用 imsubtractO 函 数 可 以 将 一 幅 图 像 从 另 一 幅 图 像 中 减 去 ， 或 者 
从 一 幅 图 像 中 减 去 一 个 常数 。imsubtract(0) 函 数 将 一 幅 输 入 图 像 的 像素 值 从 另 一 幅 输 入 图 像 相 
应 的 像 中 减 去 ， 再 将 相应 的 像素 值 之 为 输出 图 像 相 应 的 像素 值 。 执 行 两 幅 图 像 相 减 
操作 ， 生 成 如 图 6-6 所 示 的 图 像 ， 程 序 代 码 如 下 : 














=imread(rice.png); 
D=imread(cameramantif) 
13=imsubtract(LJI2); 
imview(l3) 


pealinfo: (171,13) 0 





图 6-6 图 像 减 法 运算 


3 乘法 运算 

两 幅 图 像 进 行 乘法 运算 可 以 实现 掩 模 操 作 ， 即 屏蔽 掉 图 像 的 某 些 部 分 。 一 幅 图 像 乘 以 一 
个 常数 通常 被 称 为 缩放 ， 这 是 一 种 常见 的 图 像 处 理 操作 。 如 果 使 用 的 缩放 因数 大 于 1， 那 么 
将 增强 图 像 的 亮度 ， 如 果 缩 放 因数 小 于 1， 则 会 使 图 像 变 暗 。 缩 放 操作 通常 会 产生 比 简单 添 
加 像素 偏 移 量 更 的 明暗 效果 。 这 是 因为 该 操作 能 够 更 好 地 维持 图 像 的 相关 对 比 度 。 此 
外 ， 由 于 时 频 的 卷 积 或 相关 运算 与 频 域 的 乘积 运算 对 应 ， 因 此 乘法 运算 有 时 也 成 为 一 种 技 
巧 ， 用 来 实现 卷 积 或 相关 处 理 。 

在 MAILAB 7.0 中 ， 可 以 使 用 immultiply( ) 函 数 实现 两 幅 图 像 的 乘法 或 一 幅 图 像 的 亮度 缩 
放 ，immultiply0 函 数 将 两 幅 图 像 相应 的 像素 值 进 行 元 素 对 元 素 的 乘法 操作 ， 即 图 像 矩 阵 的 点 
乘 运 算 ， 并 将 乘法 的 结果 作为 输出 图 像 相应 的 像素 值 。 例 如 ， 以 下 程序 实例 将 使 用 给 定 的 缩放 
因数 对 如 图 6-7a 所 示 的 图 像 进行 亮度 缩放 ， 从 而 得 到 如 图 6-7b 所 示 的 较为 暗淡 的 图 像 。 
























图 6-7 图 像 乘 法 运算 
al 原始 图 像 ”b) 相 乘 后 的 图 像 
imread(lena.bmp); 
PP=immultiply(L.0.5); 
figureiimshow(D); 
figure'imshow(I2) 


Uint8 类 型 的 图 像 在 进行 乘法 运算 时 ， 一 般 都 会 发 生 溢出 现象 。immultiply() 函 数 将 溢 
的 数据 截取 为 数据 类 型 的 最 大 值 。 为 了 避免 产 出 现象 ， 可 以 在 执行 乘法 运算 之 前 将 
uintg 类 型 的 图 像 转换 为 一 种 数据 范围 较 大 的 图 像 类 型 。 

4. 运算 
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图 像 ) 处 理 中 经 
相应 像素 值 的 变换 比率 ， 而 不 是 每 个 像素 的 绝对 差异 ， 因 而 图 像 除法 操作 也 称 。 

在 MATLAB 7.0 中 ， 可 以 使 用 imdivide0 函 数 进行 两 幅 图 像 的 除法 运算 或 一 幅 图 像 的 亮 
度 缩放 。imdivide 函数 对 两 幅 输 入 图 像 的 所 有 相应 像素 执行 元 素 对 元 素 的 除法 运算 ， 计 
到 的 结果 作为 输出 图 像 的 相应 像素 值 。 以 下 程序 代码 实例 将 如 图 6-8a 所 示 的 图 像 进行 除 法 
运算 ， 得 到 如 图 6-8b 所 示 的 效果 。 







为 比 














图 6-8 ”图像 除 法 运算 


a) 原始 图 像 lenabmp 。 b) 除去 一 个 常数 后 的 效果 





图 像 处 理 中 的 及 几何 变换 


Fimread(lenabmp)); 
ID=imdivide(L.0.5); 
figureimshow(D); 


figure,imshow(I2) 鹿 
6.4 几何 变换 基础 
BE5 齐 次 坐 ; | 


数字 图 像 是 把 连续 图 像 在 坐标 空间 和 性 质 空间 离散 化 了 的 图 像 。 例 如 ， 一 幅 二 维 数字 图 
像 可 以 用 一 组 二 维 (2D) 数组 f(x,y) 来 表示 ， 其 中 x 和 了 表示 2D 空 间 冯 ' 中 一 个 坐标 点 的 位 
置 ， jcy) 代表 图 像 在 点 (x,y) 的 某 种 性 质 的 数值 。 如 果 所 处 理 的 是 一 幅 灰 度 图 像 ， 这 时 
(cy) 表示 灰 度 值 ， 此 时 fox) ， 为 ?都 在 整数 集合 中 取 值 。 因 此 ， 除 了 插值 运算 外 ， 常 
见 的 图 像 几 何 变换 可 以 通过 与 其 对 应 的 矩阵 线性 变换 来 实现 。 

设 点 脉 (Co,Dm) 进行 平移 后 ， 移 到 P(x, 力 ， 其 中 x 方 向 的 平移 量 为 Ar ，》 方 向 的 平移 量 
为 Ay ， 如 图 6-9 所 示 ， 那 么 ， 点 P(x, 妇 的 坐标 为 
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图 6-9 图 像 的 平移 变换 示意 图 


《6-11) 


人 
= 力 + 


这 个 变换 矩阵 的 形式 可 以 表示 为 


和 
De 人 人 


对 式 (6-12) 进行 简单 变换 可 得 


对 式 〈6-13) 进一步 变换 ， 可 得 











《6-14) 








式 〈6-14) 中 等 号 右 侧 左面 矩阵 的 第 1、2 列 构成 单位 矩阵 ， 第 3 列 元 素 为 平移 常量 。 

该 矩阵 是 点 怠 (Cxo,)) 平移 到 点 PCx,y) 的 平移 矩阵 ， 即 为 变换 矩阵 。 该 变换 矩阵 是 2x3 阶 的 
和 矩阵， 为 了 符合 矩阵 相 乘 时 要 求 前 者 列 数 与 后 者 行 数 相 等 的 规则 ， 站 
(mm 为) 中 引入 第 3 个 元 素 ， 增 加 一 个 附加 坐标 ， 扩展 为 3x1 阶 的 列 矩阵 (mm 1。 
样 ， 式 〈6-13) 同 式 (6-14) 表述 的 意义 完全 相同 。 为 了 使 式 〈6-14) 0 
(xz ?1 的 形式 ， 可 用 三 维 空间 点 (x,%D 表示 二 维 空间 点 (x,y) ， 即 采用 一 种 特殊 的 坐 
标 ， 可 以 实现 平移 变换 ， 变 换 结果 如 下 : 

0 Ar fm 

引 

0 


关 
闻 | 王 D 攻 《6-15) 
1 1 


1 
0 
0 1 
现 对 式 〈6-15) 中 的 各 个 矩阵 进行 定义 ; 














=| ? | 为 变换 后 的 坐标 矩阵 ; 


1 
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古 =| 为 | 为 变换 前 的 坐标 矩阵 ， 


1 








己 =7 思 (6-16) 


从 式 〈6-16) 可 以 看 出 ， 引 入 附加 坐标 后 ， 扩 充 了 和 矩阵 的 第 3 行 ， 但 并 没有 使 变换 结果 
受到 影响 。 这 种 用 姑 +1 维 向 量 表示 半 维 向 量 的 方法 称 为 齐 次 坐标 表示 法 。 


标的 一 般 表 现形 式 及 意义 











1 齐 次 坐标 的 一 般 表 现形 式 
式 (6-16) 给 出 了 图 像 经 过 平移 后 齐 次 坐标 的 特殊 形式 ， 齐 次 坐标 的 一 般 形 式 可 表示 为 





已 
己 =| 也 (6-17) 
万 


式 中 ， 万 为 非 零 的 实数 。 当 太 1 时 ， 忆 =(x yy 1 称 为 规范 化 齐 次 坐标 。 地 


由 点 的 齐 次 坐标 ( 瑟 ,, 妃 ,五 ) ， 求 点 的 规范 化 坐标 (xz,%1D) 。 可 按 如 下 公式 进行 ; 





xj 一 上 (6-18) 
2. 齐 次 坐标 的 意义 
齐 次 坐标 的 几何 意义 相当 于 点 (x, 攻 落 在 3D 空间 互 =1 的 平面 上 ， 如 图 6-10 所 示 。 如 
果 将 区 平 面 内 的 A4BC 的 各 顶点 表示 成 齐 次 坐标 (x,y,D (=1L2,3) 的 形式 ， 就 变 成 五 =1 
平面 内 的 A4iBICI 的 各 顶点 。 














为 了 将 式 〈6-16) 写成 一 般 形式 ， 对 包括 平移 在 内 的 所 有 几何 变换 都 适用 ， 对 己 7， 
丁 进 行 重新 定义 ， 齐 次 坐标 为 





人 
忆 =| 两 丽 … 而， 《6-19) 
到 ”下 友 殖 
当 妃 =1 时 ， 规 范 化 的 齐 次 坐标 为 
RE 
"| 了 ? (6-20) 
| 相 
变换 矩阵 7 为 
在 面 万 
到 | 过, 汉 | (6-21) 
下 旺 


< 和 14 








Xol 320 Xon 
员 =| 加 (6-22) 


二 


则 上 述 变换 可 以 用 公式 表示 为 











四 半生 MX 30 人 Xon 
无 ] 儿 3 (6-23) 
1 靖 及 二 | TI 





引入 齐 次 坐标 后 ， 表 示 2D 图 像 几何 变换 的 3x3 阶 和 矩阵 的 功能 就 完善 了 ， 可 以 用 它 完成 
2D 图 像 的 各 种 几何 变换 。 下 面 讨 论 3x3 阶 变换 矩阵 中 元 素 在 变换 中 的 功能 。 几 何 变 换 的 
3x3 阶 和 矩阵 的 一 般 形 式 见 式 (6-21)。 


3x3 阶 矩阵 了 可 以 分 成 4 个 子 矩阵 ; 人 | 子 矩 阵 可 使 图 像 实现 恒 等 、 比 例 、 镜 
2 


业 


像 、 错 切 和 旋转 变换 ，( 己 9) 列 矩阵 可 以 使 图 像 实现 平移 变换 ，(/ “站 ) 行 矩阵 可 以 使 图 像 
实现 透视 变换 ， 但 当 !=0 ，?=0 时 ， 它 无 透视 作用 ; 8 这 一 元 素 可 以 使 图 像 实现 全 比例 变 
换 。 例 如 ， 将 图 像 进行 全 比例 变换 ， 即 
































1 0 0 大 
0 1 0l2o|=|y (6-24) 
0 0 人 1 1 
由 式 〈6-24) 可 知 ， 当 8 关 1 时 ， 等 式 两 端 不 相等 ， 若 想 等 式 成 立 ， 应 将 式 〈6-24) 变 
为 
主 GT 和 
0 1 0 和 =| 症 (6-25) 
0 0 5 八 1 1 
齐 次 坐标 规范 化 后 得 
20i 
| 人 所 
0 1 0| 关 |=|y (6-26) 
0 时 
绅 
有 


由 式 〈6-26) 可 见 ， 当 >1 时 ， 图 像 按 比例 缩小 ,如 *=2， x= 辽 ， 图 像 缩 


小 到 原来 的 2; 当 0<s<1 时 ， 整 个 图 像 按 比例 放大 ， 如 s=1/2 ，x=2xm，7y=2)， 图 像 
放大 到 原来 的 2 倍 ; 当 5 =1 时 ，x=za，)= 力 ， 图 像 大 小 不 变 。 





1. z 图 像 平 移 变换 


平移 是 日 常生 活 中 最 普遍 的 方式 之 一 ， 如 开学 时 教室 里 课 桌 的 重新 摆 放 等 都 可 以 视 为 平 
移 运动 。 图 像 的 平移 是 将 一 幅 图 像 上 的 所 有 像素 点 都 按 给 定 的 偏 移 量 沿 x 方 向 〈 水 平方 向 ) 
和 》 方 向 〈 垂 直方 向 ) 进行 移动 ， 如 图 6-11 所 示 。 图 像 的 平移 变换 是 图 像 几何 变换 中 最 简 
单 的 变换 之 一 。 














本 
图 6-11 图 像 的 平移 
引 平移 前 b) 平移 后 


若 点 4(xm,Jm) 进 行 平移 后 ， 被 移 到 4(x,) 位 置 ， 其 中 ，x 方向 上 的 平移 量 为 Ax ，》 方 
向 上 的 平移 量 为 Ap ， 那 么 ， 点 4(x, 妇 的 坐标 为 《此 公式 6.4 节 已 经 列 出 ): 
| 
DJ 了 = 加 + 人 
利用 齐 次 坐标 ， 点 4x 妨 的 坐标 可 以 表示 如 下 《〈 此 公式 6.4 节 已 经 列 出 ): 
xz] fl 0 Acel| 
动 中 ET 于 
相应 地 ， 也 可 以 根据 点 4s 世 求解 原始 点 4 和 (xm, 加 ) 的 坐标 ， 即 





af1 0 -ArYx 
为 |=|o 1 -el (6-27) 
人 OO 人 











显然 ， 以 上 两 个 变换 矩阵 互 为 逆 矩 阵 。 

图 像 平移 变换 的 特点 是 平移 后 的 图 像 与 原 图 像 完全 相同 ， 平 移 后 新 图 像 上 的 每 一 点 都 可 以 在 
以 求 出 对 应 原始 图 像 中 的 像素 点 〈-2，-2)， 该 点 不 在 原始 图 像 中 。 对 于 不 在 原始 图 像 中 
的 点 ， 可 以 直接 将 它们 的 像素 值 统一 设置 为 0 或 2355， 对 于 灰 度 图 像 则 为 黑色 或 白色 。 反 


记 












显示 [ 





芝 : 





被 移出 了 显示 区 域 。 图 像 
0 则 应 扩大 新 图 像 
区 域 
像 平 移 变 换 的 MATLAB 实现 














下 面 是 图 像 平 移 的 程序 代码 实例 〈 见 图 6-12): 


[=imread(trees-tif); 
figure,imshow(D); 
I=double(D; 
1L_movesult=zeros(size(D); 





Move_y=50; 
L_movesult(Move_x+1:HUD),Move_y+1 HOC),1HG))ICLHO)-Move_x,1:HOC)-Move_y,1:HG); 
imshow(uint8(L_movesulb); 





图 6-12 图 人 
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al 原始 图 像 b) 平移 后 的 图 像 


E 且 四 像 比 似 坟 的 | 
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Q 倍 ， 


则 图 像 的 比例 缩放 会 改变 
如 (xz 加) 比例 








图 像 比例 变换 

青 况 下 ， 数 字 图 像 的 比例 缩放 是 指 给 蜀 像 在 x 方向 和 了 方向 按 相同 的 比例 缩放 
从 而 获得 一 幅 新 的 图 像 ， 又 称 为 全 比例 缩放 。 如 果 x 方向 和 了 方向 缩放 的 比例 不 同 ， 
图 像 像素 间 的 相对 位 置 ， 产 生 几 何 畸 变 。 设 原始 图 像 中 的 点 
新 图 像 中 的 对 应 点 为 40ox,n) ， 则 丰 G, 芭 7) 和 (5, 力 ) 之 间 的 


















放 后 ， 在 





坐标 关系 可 表示 为 











二 OO 
让 7=|o a ol (6-28) 
人 





处 理 中 的 代数 交 
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1 二 Co 
必 沁 包 

若 比例 缩放 所 产生 的 图 像 中 的 像素 在 原始 图 像 中 没有 相对 应 的 像素 点 时 ， 就 需要 进行 灰 
度 值 的 插值 运算 ， 一 般 有 以 下 两 种 插值 处 理 方法 。 

1) 直接 赋值 为 和 它 最 相近 的 像素 灰 度 值 ， 这 种 方法 称 为 最 邻近 插值 法 (Nearest Neighbor 
JInterpolation)， 该 方法 的 主要 特点 是 简单 、 计 算 量 很 小 ， 但 可 能 会 产生 马赛 克 现象 。 

2) 通过 其 他 数学 插值 算法 来 计算 相应 的 像素 点 的 灰 度 值 ， 这 类 方法 处 理 效果 好 ， 但 运 

量 会 有 所 增加 。 

在 式 〈6-28) 所 表示 的 比例 缩放 中 ， 若 wa>1， 则 图 像 被 放大 ; 若 a<1， 则 图 像 被 缩 
小 。 以 a=1/2 为 例 ， 即 图 像 被 缩小 为 原始 图 像 的 一 半 。 图 像 被 缩小 一 半 以 后 根据 目标 图 像 
和 原始 图 像 像 素 之 间 的 关系 ， 有 如 下 两 种 缩小 方法 。 

第 一 种 方法 如 图 6-13 所 示 ， 此 时 缩放 前 后 图 像 间 像素 点 的 对 应 关系 如 下 : 








匡 
图 6-13 ”图像 缩小 一 半 《 偶 数 行 和 偶数 列 构成 新 的 图 像 ) 


a 原始 图 像 b) 缩小 后 的 图 像 


(0.0) <> (0.0) 
《01) <> (0.2) 
(0.2)<> (0,4) 
(0.3) <> (0.6) 
(0O) <> (2,0) 
缩小 图 像 1(2,0) <> (4.0) | 原始 图 像 


(3,0)<> (6.0) 
(3.D<> (6.2) 
(3,.2) > (6,4) 
(3.3) <> (6.6) 
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区 二 国 国 国生 
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依 此 类 推 ， 可 以 逐 点 计算 缩小 图 像 各 像素 点 的 值 ， 图 像 缩 小 之 后 所 承载 的 信息 量 为 
人 图像 的 50%， 即 在 原始 图 像 上 ， 按 行 优先 的 原则 ， 对 所 处 理 的 行 ， 每 隔 一 个 像素 取 
一 点 ， 每 隔 一 行进 行 一 次 操作 。 也 就 是 说 ， 取 原始 图 像 的 偶数 行 和 偶数 列 构成 新 的 图 
像 。 








一 种 方法 是 取 原 始 图 像 的 奇数 行 和 奇数 列 组 成 新 的 图 像 ， 如 图 6-14 所 示 。 





ce> 





b 
图 6-14 图 像 缩小 一 半 《 奇 数 行 和 奇数 列 构成 新 的 图 像 ) 


到 原始 图 像 b) 缩小 后 的 图 像 


如 果 图 像 按 任意 比例 缩小 ， 则 以 类 似 的 方式 按 比例 选择 行 和 列 上 的 像素 点 。 若 工 方向 与 
方向 缩放 比例 不 同 ， 则 这 种 变换 将 会 使 缩放 以 后 的 图 像 产生 几何 畸变 。 图 像 x 方 向 与 了 方 
向 的 不 同比 例 缩放 的 变换 公式 如 下 : 


Q 关 〈6-29) 











图 像 缩小 变换 是 在 已 知 的 图 像 信 息 中 以 某 种 方式 选择 需要 保留 的 信息 。 反 之 ， 图 像 的 放 
大 变换 则 需要 对 图 像 尺寸 经 放大 后 所 多 出 来 的 像素 点 填 入 适当 的 像素 值 ， 这 些 像素 点 在 原始 
图 像 中 没有 直接 对 应 点 ， 需 要 以 某 种 方法 进行 估计 。 以 a=2= 2 为 例 ， 即 原始 图 像 按 全 比例 
放大 2 倍 ， 实 际 上 ， 这 是 将 原始 图 像 每 行 中 各 像 芭 复 取 一 遍 值 ， 然 后 每 行 重复 一 次 。 根 
据 理论 计算 ， 放 大 以 后 图 像 中 的 像素 点 〈0,0) 对 应 于 原始 图 像 中 的 像素 点 〈0,0)，(0,.2) 对 
应 于 原始 图 像 中 的 〈0,1)， 但 放大 后 图 像 的 像素 点 〈01) 对 应 于 原始 图 像 中 的 像素 点 
(0.0.5)，(1.0) 对 应 于 原始 图 像 中 的 〈0.5.0)， 原 始 图 像 中 不 存在 这 些 像 素 点 ， 那 么 放大 后 
的 图 像 如 何 处 理 这 些 问题 呢 ? 以 像素 点 〈0.0.5) 为 例 ， 这 时 可 以 采取 以 下 两 种 方法 和 原始 图 
像 对 应 ， 其 余 点 依 此 逐 点 类 推 。 

1) 将 原始 图 像 中 的 像素 点 〈0,0.5) 近似 为 原始 图 像 的 像素 点 〈0,0)。 

2) 将 原始 图 像 中 的 像素 点 〈0,0.5) 近似 为 原始 图 像 的 像素 点 〈0,1)。 

以 图 6-15 所 示 的 一 段 直 线 为 例 来 说 明 这 两 种 放大 的 细微 差别 。 
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图 6-15 ”放大 前 的 原始 图 像 


若 采取 第 1 种 方法 ， 则 原始 图 像 和 放大 图 





(0.0) <> (0.0) 
(0.D)<>(0.0) 
(0) <> (0.0) 
(LID) <e> (0.0) 
(2.2) <> (LID) 
(23)<> (LID) 
(3,2)<> (LU 
(3.3) <> (LID) 
(4,4)<> (2,2) 
(4.5) <> (2.2) 
(5,4) <> (2,2) 
【(5.5)e> (2.2) 










































































像 的 像素 点 对 应 关系 如 下 


原始 图 像 
















































































6 按 最 近邻 志 











加 像 和 放大 图 






































法 放大 两 倍 的 图 像 


像 的 像素 点 对 应 
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应 的 放大 图 像 如 图 6-17 所 示 。 











(0.0) <> (0.0) 
(0D) <e> (0.) 
(0)<> (0) 
(CD<e> (LID) 
(2)<> (LTD 
(2.D) <> (LID) 
(22)<> (LID) 
(2.3)<> (LD) 
(3.2)<> (LTD 
(3.3)<> (LTD 
(3,4) <> (2.2) 
(4.3)<> (2.2) 
(44)<> (2,2) 
(S,.5)<> (3.3) 
(5,.6) <> (3,3) 
(6.3) <> (3,3) 
(6,6) <> (3,3) 































































































- 般 地 ， 按 比例 将 
到 新 图 像 的 Qx a 的 方块 











图 6-17 按 插值 方法 放大 两 倍 的 图 像 


Q 倍 时 ， 如 果 按 





困 此 ， 两 种 放大 方式 具有 















































最 近邻 域 法 ， 则 需 
图 6-18 所 示 。 因 此 ， 如 果 放大 倍数 过 大 ， 则 按照 这 

















充 灰 度 值 会 出 现 马赛 克 效应 。 为 了 避免 马赛 克 效应 ， 提 高 几何 变换 后 的 图 像 质量 ， 可 以 采用 
不 同 复杂 程度 的 线性 插值 法 放大 后 所 多 出 来 的 相关 像素 点 的 灰 度 值 。 
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法 放大 四 倍 的 图 像 











图 像 比例 变换 的 MATLAB 实现 
图 像 缩放 的 MATLAB 应 用 ， 图 像 缩放 函数 的 格式 参考 以 下 程序 代码 : 





Jimread(trees:tif); 
imshow(J); 
XI1=imresize( 





X2=imresize(J.0.5) % 缩 小 





figure,imshow(X1; 
figure,imshow(X2) 


执行 程序 后 结果 如 图 6-19 所 示 


避 划 


图 6-19 图 像 缩放 











b) 放大 后 的 图 像 ”e) 缩小 后 的 图 像 





像 旋转 变换 | 





， 旋转 亚 换 
2 (Rotation) 有 一 个 绕 着 什么 转 的 问题 。 通 常 的 做 法 是 ， 以 图 像 的 中 心 为 圆心 旋 
转 ， 将 图 像 上 的 所 有 像素 都 旋转 一 个 相同 的 角度 。 图 像 的 旋转 变换 是 图 像 的 位 置 变换 ， 但 旋 
转 后 ， 图 像 的 大 小 一 般 会 改变 。 和 图 像 平 移 变换 一 样 ， 在 图 像 旋转 变换 中 ， 可 以 把 转 出 显 


1 显示 
























区 域 的 图 像 截 去 ， 旋 转 后 也 可 以 扩大 图 像 范 围 以 显示 所 有 的 图 像 。 图 6-20 是 旋转 前 的 图 
像 ， 图 6-21 是 将 图 6-20 旋转 30"〈 顺 时 针 方向 ) 后 保持 原 图 像 大 小 ， 转 出 的 部 分 被 裁 掉 的 
情况 ;图 6-22 是 不 裁 掉 转 出 部 分 ， 旋 转 后 图 像 放大 的 情况 。 





2 本 


图 6-20 ”旋转 前 的 图 像 图 6-21 保持 原 图 像 大 小 的 旋转 图 6-22 ”图像 放 大 的 旋转 





采用 不 裁 掉 转 出 部 分 ， 旋 转 后 图 像 变 大 的 做 法 〈 见 图 6-22)， 首 先 给 出 变换 矩阵。 在 我 
们 热 悉 的 坐标 系 中 ， 如 图 6-23 所 示 ， 将 一 个 点 顺 时 针 旋转 角 ，7 为 该 点 到 原点 的 距离 ， 
妨 为 与 x 轴 之 间 的 夹 角 。 在 旋转 过 程 中 ，r 保持 不 变 。 

设 旋转 前 xo ， Jo 的 坐标 分 别 为 a =rcoss， 芒 =rsinb 。 当 旋转 w 角度 后 ， 坐 标 交 , 久 


的 值 分 别 为 
的 =rcos( 一 qd=rcosbcosa+rsinbsina=xocosa+Josina 《6.30) 
为 =rsin( 一 ao)=rsinbgcosa 一 rcosbsina= 一 xsina+ 区 cosa 
以 矩阵 的 形式 表示 为 
cosa -sina 0 
(0 D=(m 为 sina ceosa 0 (6-31) 
0 0 1 








式 (6-31) 中 ， 坐 标 系 xOy 是 以 图 像 的 中 心 为 原点 ， 向 右 为 x 轴 正方 向 ， 向 上 为 了 轴 正 
方向 。 它 与 以 图 像 左上 角 点 为 原点 0 ， 向 右 为 x 轴 正 方向 ， 向 下 为 必 轴 正方 向 的 坐标 系 


xx 之 间 的 转换 关系 如 图 6-24 所 示 。 
O 学 
国 
本 全 


图 6-23 ”旋转 示意 图 图 6-24 ”两 种 坐标 系 间 的 转换 关系 
设 图 像 的 宽 为 w ， 高 为 疡 ， 容 易 得 到 





TIER 0 
CDSLR 0 -1 1 06-32) 


一 语 W 人 二 让 








逆 变 换 为 


( 室 全 ) 区 本 证 





玫 0 0 
O 0 


-0.5w 0.5hn 1 


有 了 式 〈6-31) 一 〈6-33)， 可 以 将 变换 分 成 3 个 步骤 来 完成 : 
1) 将 坐标 系 x0y 变 成 xOy 。 


(6-33) 包 
2) 将 该 点 顺 时 针 旋转 a 角 。 


3) 将 坐标 系 xOy 变 回 xOy ， 这 样 ， 就 得 到 了 如 下 的 变换 矩阵 〈 是 上 面 3 个 矩阵 的 级 


4 0 01ecosa -sina 0 
0 二 01sina cosa 0 


1 0 0 
GD=(O 为 了 0 E 0 
1 八 -0.5ws。 0.5As， 1 











人 
cosa sina 0 
晤 1) 一 sina cosa 0 
为 “| -0.5waacosa+ 一 0.5wuusina- 


0.5Hnuasina--0.5wo。 0.5Hhuucosa+0.51e 


〈6-34) 
式 中 ，wu ， hu， ww ， hn 分 别 表示 原 图 像 的 宽 、 高 和 新 图 像 的 宽 、 高 。 式 〈6-34) 的 逆 
变换 为 


cosa sina 0 


-sina cosa 0 


1 0 0 
(人 为 D=(x 六 中 0 可 | 











1 0 0 
0 本 | 0 
0.5wua 0.5Aa 1 


05E SA ED 汪汪 可 
cosa -sin a 0 
sina Cosa 0 
= 1 
全 | 二 Sws cosa 一 0.5wvsina 一 2 


0.5Nessina+0.Swag 0.5Nss cosa 二 0.SN 


这 样 ， 对 于 新 图 像 中 的 每 一 点 ， 就 可 以 根据 式 〈6-34) 求 出 对 应 原 图 像 中 的 点 ， 并 得 到 
它 的 灰 度 。 如 果 超 出 原 图 像 范围 ， 则 填 成 白色 。 要 注意 的 是 ， 由 于 有 浮 点 运算 ， 计 算出 来 的 
点 的 坐标 可 能 不 是 整数 ， 需 要 采用 取 整 处 理 ， 即 找 最 接近 的 点 ， 这 样 会 带 来 一 些 误差 《图 像 
可 能 会 出 现 锯齿 )。 更 精确 的 方法 是 采用 插值 ， 这 将 在 6.6 节 中 进行 介绍 。 





ATLABE 二 玉 汪 








2. 图像 旋转 变换 的 MATLAB 实现 
图 像 分 别 逆 时 针 旋转 30"、45* 和 60? 的 程序 代码 如 下 ， 程 





了 结果 如 图 6-25 所 示 。 





[=imread(peppers.png)) 

imshow(D; 
X1=imrotate(L,30,nearest); % 旋 转 30? 
figure; 

imshow(uintS(X1)); 

figure; 

X2=imrotate(L.45,nearest); % 旋 转 45。 
imshow(uint8(X2)); 

figure; 

X3=imrotate(L.60,nearest); % 旋 转 60" 
imshow(uint8CX3)); 





图 6-25 ”图像 旋转 变换 


al 原始 图 像 b) 旋转 30* 后 的 图 像 e) 旋转 45" 后 的 图 像 d) 旋转 60? 后 的 图 像 











E5 像 镜像 变换 | 


图 像 的 镜像 变换 不 改变 图 像 的 形状 ， 图 像 的 镜像 《Mirror) 变换 分 为 3 种 : 水 平 镜像 、 人 
垂直 镜像 和 对 角 镜 像 。 

1. 图 像 的 水 平 镜像 

设 图 像 的 水 平 镜像 操作 是 将 图 像 左 半 部 分 和 右 半 部 分 以 图 像 垂直 中 轴线 为 中 心 进行 镜像 
对 换 。 设 图 像 的 大 小 为 M x N ， 水 平 镜 像 可 按 式 〈6-36) 计算 : 


隐 
(6-36) 
了 =N=-J+l 

式 中， 人心 妃 为 原 图 像 FG,7) 中 像素 点 的 坐标 ， (7 为 对 应 像素 点 
厅 G', 门 中 的 坐标 。 设 原 图 像 的 矩阵 为 


厂 丰 页 不 大 
户 记 应 启 启 
下 =| 甩 应 记忆 启 (6-37) 
矶 jj 和 记 
万 订 记 有 左 启 


经 过 水 平 镜像 的 图 像 ， 行 的 排列 顺序 保持 不 变 ， 将 原来 的 列 排列 /=12,3,4,5 转换 成 
太 =543,2.1， 即 


六 放水 平 镜 像 变 换 后 图 像 





0 
订户 
下 =| 高 入 遍 庙 广 06-38) 
订 册 席 态 
向 





2. 图像 的 垂直 镜像 
图 像 的 垂直 镜像 操作 是 将 图 像 上 半 部 分 和 下 半 部 分 以 图 像 水 平 中 轴线 为 中 心 进行 镜像 对 
换 。 设 图 像 的 大 小 为 M x N ， 垂 直 镜 像 可 按 式 (6-39) 计算 ， 
让 M-=-i+l 
7=7 





〈6-39) 


式 中 ，( 必 7 为 原 图 像 FG, 7) 中 像素 点 的 坐标 ， (六 7) 为 对 应 像素 点 心 刀 垂 直 镜像 变换 后 图 像 
万 (人 刀 门 中 的 坐标 。 

设 原始 图 像 的 矩阵 见 式 〈6-37)， 经 过 垂直 镜像 的 图 像 ， 列 的 排列 顺序 保持 不 变 ， 将 原 
来 行 的 排列 =12,3,4,5 转 换 成 = 3,4,3,2,1 ， 即 














万 矶 页 而 
页 友 因 及 疝 
瑟 =| 有力 记 启 A 启 6-40) 
页 访 启 训 访 
丰 碟 矶 不 布 


3. 图 像 的 对 角 镜 像 

图 像 的 对 角 镜 像 操 作 是 将 图 像 以 图 像 水 平 中 轴线 和 垂直 中 轴线 的 交点 为 中 心 进 行 镜像 
对 换 。 相 当 于 将 图 像 先 后 进行 水 平 镜像 和 垂直 镜像 。 设 图 像 的 大 小 为 M x N ， 对 角 镜 像 可 
按 式 (6-41) 计算 : 


之 = M -ii+1l 
| 《6-41) 


7=N-7-1 


式 中 ，( 亿 7) 为 原 图 像 FG,7) 中 像素 点 的 坐标 ; (人 门 为 对 应 像素 点 传 刀 对 角 变 换 后 图 像 
娓 (六 门 中 的 坐标 。 设 原 图 像 的 矩阵 见 式 〈6-37)， 经 过 对 角 镜 像 的 图 像 ， 将 原来 的 行 排 
列 i=12,3,4,5 转 换 成 过 5,4,3,2,1， 将 原来 的 列 排列 j =12,3,4,5 转换 成 汪 = 5,4,3,2,1， 即 


友和 厅 左 太 
大 负 谍 帮 
站 = 六 的， 6-42) 
遍 办 户 万 - 广 
万 友 而 页 礁 


4 图像 镜像 变换 的 MATLAB 实现 
垂直 、 水 平和 对 角 镜 像 的 程序 如 下 : 其 中 ，I1 为 原始 图 像 ，Z 为 垂直 镜像 ，I3 为 水 平 
镜像 ，]I4 为 对 角 镜 像 。 





Il=imread(F:\image\fjjpg); 

Ti=double(D); 

figure()》， 

imshow(uint8G1)); 

H=size(l); 

figure(2)， 

DG:HO),1L:HC)1:HG)=IIHO):-111:HC),1:H(G3); % 垂 直 镜 像 
imshow(uint8Gl2)); 

figure(G3)， 

BUG:HODJLHC)LHG)-IIGHOJHO)-111:HG); % 水 平 镜像 
imshow(uint8(3)); 

figure(4)， 

HG:HO),LHO)LHG)-IIHO):-11HO):-1113HG); % 对 角 镜 像 
imshow(uint8G4)); 





处 理 中 的 代 孝 





程序 运行 结果 如 图 6-26 所 示 。 
生 避 









图 6-26 ”图像 镜 像 变 换 
a 原始 图 像 。b) 垂直 镜像 ec) 水 平 镜像 。d) 对 角 镜 像 


像 剪 切 变 换 
1. 图 像 剪 切 变换 


当 只 需要 处 理 图像 中 的 一 部 分 时 ， 或 者 需要 将 某 一 部 分 取出 ， 这 样 就 要 对 图 像 进行 前 
切 。MATLAB 7.0 图 像 处 理工 具 箱 提供 了 函数 imerop() 用 于 前 切 图 像 中 的 一 个 矩形 图 ， 用 户 





函数 imcrop0 的 语法 格式 为 


ID=imrcop(D) 

X2= imrcop(X, map) 
RGB2= imrcop(TGB) 

D= imrcop(l, recb 

X2= imrcop(X, map, rect) 
RGB2= imrcop(RGB, rect) 
[二 imrcopGx,y， …) 
[A，rectj= imrcop(…) 
[xy,rect= imrcop(…) 





其 中 ，P=imrcop()、X2= imrcop(X，map) 和 RGB2= imrcop(TGB) 为 交互 式 地 对 灰 度 图 
像 、 索 引 色 图 像 和 真 彩色 图 像 进行 前 切 。I= imrcop(，recD、X2= imrcop(X，map，recD 和 
RGB2= imrcop(RGB，recb 按 指定 的 矩形 框 rect 剪 切 图 像 ，rect 是 一 个 四 元 向 量 [xmin ymin 
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width height]， 四 个 分 量 分 别 表示 和 矩形 的 左上 角 的 坐标 、 宽 度 和 高 度 。[…]= imrcop(x , yy …) 
在 指定 坐标 系 (x, y) 中 前 切 图 像 。[A，rectj= imrcop(…) 和 [x, y rectl= imrcop(…) 在 用 户 手 动 选 
取 剪 切 图 像 的 同时 返回 前 切 框 的 参数 rect。 
2 图像 剪 切 的 MATLAB 实现 
下 面 的 例子 将 从 一 幅 图 像 中 前 切 一 块 子 图 像 ， 坐 标 为 (80，70) 一 (220，178)， 结 果 如 
图 6-27 所 示 。 
Il=imread(F:\imageNjjjpg); 
I2=imcrop(T1,[75 68 220 100]); 
imview(lD),imview(I2); 





图 6-27 图 像 剪 切 变换 


下 原始 图 像 ”b) 剪 切 后 的 图 像 


[EE 末 俯 复合 支 的 | 


图 像 的 复合 变换 是 指 对 给 定 的 图 像 进行 两 次 或 两 ， 
本 变换 的 多 次 变换 ， 又 称 为 级 联 变换 。 由 于 引入 章 图 像 的 基本 变换 采用 了 统一 的 抵 
阵 表 示 形 式 ， 根 据 矩阵 理论 可 知 ， 对 给 定 图 像 按 顺序 连续 进行 多 次 基本 图 像 变 换 ， 其 变换 的 
矩阵 仍然 可 以 用 3x3 抢 阵 表示 。 复 合 变换 的 矩阵 等 于 基本 变换 的 矩阵 按 变换 顺序 依次 相 乘 。 

若 对 图 像 依次 进行 了 次 平移 、 镜 像 、 比 例 、 旋 转 等 基本 变换 ， 其 变换 矩阵 分 别 为 
下 ,五 …, ， 则 次 变换 之 后 的 复合 变换 矩阵 全 可 以 表示 为 

了 了 = 了 五 … 和 了- (6-43) 
根据 复合 变换 的 组 合 类 型 ， 复 合 变换 可 以 分 为 如 下 两 类 。 

1 同类 型 复合 变换 

复合 变换 由 同一 种 基本 变换 组 成 ， 即 相同 的 基本 变换 连续 进行 多 次 ， 如 复合 平移 、 复 合 
比例 缩放 、 复 合 旋转 等 。 

2 不 同类 型 的 复合 变换 

复合 变换 由 不 同类 型 的 基本 变换 组 成 ， 即 不 同 的 基本 变换 连续 进行 多 次 ， 如 图 像 的 转 
置 、 绕 任意 点 的 比例 缩放 、 绕 任意 点 的 旋转 等。 

现 对 同类 型 的 复合 变换 讨论 如 下 。 





上 的 平移 、 镜 像 、 比 例 、 旋 转 等 基 












(1) 复合 平移 


以 包含 两 次 基本 平移 的 复合 平移 为 例 ， 指 将 图 像 先 平移 到 新 的 位 置 4Cn,%) 后 ， 再 将 图 
像 平 移 到 位 置 小 (x,P) ， 复 合 平移 矩阵 为 
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观察 复合 平移 矩阵 了 可 以 发 现 ， 两 次 平移 之 后 ， 平 移 的 距离 等 于 两 次 平移 距离 之 和 。 因 
此 ， 采 用 齐 次 坐标 表示 几何 变换 ， 不 仅 形式 简洁 ， 而 且 具 有 明显 的 几何 意义 。 两 次 以 上 的 复 
合 平移 变换 可 由 此 类 推 。 

(2) 复合 比例 

同样 ， 以 包含 两 次 比例 缩放 变换 的 复合 缩放 变换 为 例 ， 复 合 比例 矩阵 为 
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7T=TZE|o aolo 到 ol=lo 纪 ， (6-45) 
09 0 环 1 人 SA 人 OA 
对 图 像 连续 进行 多 次 比例 缩放 变换 ， 最 后 的 复合 比例 矩阵 ， 只 需要 对 两 次 变换 的 比例 常 
数 进 行 乘积 运算 即 可 。 
(3) 复合 旋转 


类 似 地 ， 对 图 像 连续 进行 多 次 旋转 变换 ， 最 后 合成 的 旋转 变换 矩阵 等 于 各 次 旋转 角度 之 
和 。 以 包含 两 次 旋转 变换 的 复合 旋转 变换 为 例 ， 复 合 旋转 矩阵 如 下 : 

cos 有 sin 有 0 cosP sinm 0 

了 = 了 T 了 | -sin 和 cos 有 0| -sinB， cosP， 0 

0 0 1 0 0 1 








cos(B+ 记 ) sin(08+D) 0 
-sin( 了 + 羽 ) cos0J+ 记 ) 0 
0 0 遇 


(6-46) 








以 上 均 为 相对 于 原点 《图 像 中 心 ) 进行 比例 、 旋 转 等 复合 变换 ， 如 果 要 相对 其 他 参考 点 
进行 以 上 变换 ， 则 要 先进 行 平移 ， 然 后 再 进行 其 他 基本 变换 ， 最 后 形成 图 像 的 复合 变换 。 不 
同 的 复合 变换 ， 所 包含 的 基本 变换 的 数量 和 次 序 各 不 相同 ， 但 是 无 论 其 变换 过 程 多 么 复杂 ， 
都 可 以 分 解 成 若干 基本 变换 组 成 ， 都 可 以 采用 齐 次 坐标 表示 ， 且 图 像 复 合 变换 矩阵 由 一 系列 
基本 变换 矩阵 依次 相 乘 而 得 到 。 


| 55: 透视 投影 | 

在 光线 的 照射 下 ， 三 维 物体 可 以 在 二 维 平面 上 形成 投影 ， 这 种 将 三 维 物体 或 对 象 转变 为 
二 维 图 形 表示 的 过 程 称 为 投影 变换 ， 投 影 中 心 称 为 视点 。 根 据 视点 与 投影 平面 之 间距 离 的 不 
同 ， 投 影 可 分 为 平行 投影 和 透视 投影 。 平 行 投影 的 视点 与 投影 平面 之 问 的 距离 为 无 穷 大 ， 若 





请 





该 距离 是 有 限 的 则 称 为 透视 投影 。 

透视 投影 即 透视 变换 ， 透 视 投影 的 距离 决定 着 透视 投影 的 透视 缩小 效应 ， 三 维 物 体 或 对 
象 透视 投影 的 大 小 与 物体 到 视点 的 距离 成 反比 。 例 如 ， 平 行 于 投影 面 且 长 度 相等 的 两 段 直 
线 ， 离 投影 中 心 距离 较 近 的 线段 ， 其 透视 投影 长 ， 离 投影 中 心 远 的 线段 ， 其 透视 投影 短 。 这 
种 效应 所 产生 的 视觉 效果 与 照相 机 系统 、 人 的 视觉 系统 十 分 相似 。 与 平行 投影 相 比 ， 透 视 投 
影 的 深度 感 更 强 ， 看 上 去 更 真实 ， 但 透视 投影 不 能 真实 地 反映 物体 的 精确 尺 十 和 形状 。 

透视 投影 时 ， 平 行 于 投影 面 的 平行 线 的 投影 依然 平行 ， 而 不 平行 于 投影 面 的 平行 线 的 投 
影 则 会 聚集 到 一 个 点 ， 这 个 点 称 为 灭 点 〈Vanishing Point)。 灭 点 可 以 看 做 是 无 限 远 处 的 一 
点 在 投影 面 上 的 投影 。 透 视 投影 的 灭 点 可 以 有 无 限 多 个 ， 不 同方 向 的 平行 线 在 投影 面 上 就 
可 以 形成 不 同 的 灭 点 ， 其 中 坐标 轴 方 向 的 平行 线 在 投影 面 上 所 形成 的 灭 点 称 为 主 灭 点 。 对 
于 三 维 空间 (x、》、z 3 个 坐标 轴 ) 主 灭 点 最 多 有 3 个 。 透 视 投 影 一 般 根据 主 灭 点 的 数量 
5 即 按 投影 面 与 坐标 轴 的 夹 角 ) 进行 分 类 ， 因 此 可 分 为 一 点 透视 、 二 点 透视 和 三 点 透视 ， 
如 图 6-28 所 示 。 

以 一 点 透视 为 例 ， 如 图 6-28a 所 示 ， 它 仅 有 一 个 主 灭 点 ， 即 投影 面 与 一 个 坐标 轴 正 交 ， 
与 另外 两 个 坐标 轴 平 行 。 进 行 一 点 透视 投影 变换 时 ， 应 考虑 好 投影 的 布局 ， 以 避免 三 维 物体 
或 对 象 的 平面 域 积 聚 成 直线 或 直线 积聚 成 点 而 影响 直观 性 。 主 要 考虑 如 下 几 点 : 

1) 三 维 物体 或 对 象 与 画面 〈 投 影 面 ) 的 相对 位 置 。 

2) 视 距 ， 即 视点 与 画面 的 距离 。 

3) 视点 的 高 度 。 

如 图 6-29 所 示 ， 设 视点 在 坐标 原点 ， 2 坐标 轴 方 向 与 观察 方向 重合 一 致 ， 点 PCx, 了 
为 三 维 物体 或 对 象 上 的 一 点 ， 经 一 点 透视 变换 后 在 投影 面 〈 观 察 平 面 ) UOF 上 的 对 应 点 为 
PCxe,yz) ， 投 影 面 与 视点 的 距离 为 4 ， 并 与 z 轴 垂 直 ，z 轴 过 投影 面 窗口 的 中 心 ， 窗 口 是 
边 长 为 2a 的 正方 形 ， 根 据 几 何 学 知识 可 得 : 
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人 《6-47) 
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图 6-28 透视 变换 的 类 型 
引 一 点 透视 b) 二 点 透视 e) 三 点 透视 





放 投影 平面 世 
图 6-29 一 点 透视 变换 原理 
利用 齐 次 坐标 ， 与 二 维 几何 变换 类 似 ， 将 该 过 程 写成 变换 矩阵 形式 为 
大 
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这 就 是 图 像 的 一 点 透视 变换 ， 即 
(了 D-[z 汪 洒 和 |] (6-49) 
站 到 


实际 上 ， 一 般 情 况 下 ， 一 点 透视 变换 矩阵 也 可 以 用 一 个 4x4 的 矩阵 表示 。 





平行 投影 不 具有 缩小 性 ， 能 精确 反映 物体 的 实际 尺寸 。 平 行 线 的 平行 投影 仍 是 平行 线 。 
平行 投影 可 根据 投影 方向 与 投影 面 的 夹 角 分 成 正 投影 和 斜 投影 两 种 。 当 投影 方向 与 投影 面 的 
夹 角 为 90" 时 ， 得 到 的 投影 为 正 投影 ， 否 则 为 斜 投影 。 是 平行 投影 中 的 两 类 投影 模式 的 原理 
示意 图 如 图 6-30a、b 所 示 。 

1.， 正 投影 

如 图 6-30c、d 所 示 ， 依 据 投 影 平面 的 法 矢量 的 方向 ， 正 投影 又 分 为 三 视图 和 正 轴 侧 两 
种 模式 。 
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图 6-30 平行 投影 及 正 投影 示意 图 
申 正 投影 b) 斜 投影 中) 三 视图 d) 正 轴 侧 





当 投影 平面 与 某 一 坐标 轴 垂 直 时 ， 得 到 的 投影 称 为 三 视图 。 三 视图 分 为 主 视图 、 侧 视图 
和 俯视 图 ， 对 应 的 投影 平面 分 别 与 、x 、》 轴 垂 直 。 图 6-31 是 一 个 物体 〈 房 屋 ) 的 三 视 
图 ， 从 图 中 可 以 看 到 ， 从 三 个 不 同 的 方向 得 到 的 同一 个 物体 的 形状 是 不 一 样 的 。 三 视图 常用 
于 工程 制图 ， 因 为 在 工程 制图 上 可 以 测量 距离 和 角度 。 但 一 个 方向 上 的 视图 只 反映 物体 的 - 
个 侧面 ， 只 有 将 三 个 方向 上 的 视图 结合 起 来 ， 才 能 综合 出 物体 的 空间 结构 和 形状 。 






































下 b) 日 中 
图 6-31 三 视图 示意 
a 引 三 视图 b) 主 视图 e) 俯视 图 d) 侧 视图 
将 三 视图 投影 变换 用 齐 次 坐标 来 表示 。 设 点 已 在 三 维 空间 的 坐标 为 (x,),z) ， 其 投影 点 
书 在 三 维 空间 上 的 坐标 为 (xw,yw*zr) ， 则 在 齐 次 坐标 下 ， 主 视图 、 侧 视图 和 依 视 图 的 变换 
见 式 〈6-50) 一 〈6-52)。 
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非 三 视图 的 平行 投影 为 正 轴 侧 ， 如 图 6-32 所 示 。 正 轴 侧 有 等 轴 侧 、 正 二 侧 和 正三 侧 三 
种 。 当 投影 面 与 三 个 坐标 轴 之 间 的 夹 角 都 相等 时 为 等 轴 侧 ， 当 投影 面 与 两 个 坐标 轴 之 间 的 夹 角 
相等 时 为 正 当 投影 面 与 三 个 坐标 轴 之 间 的 夹 角 都 不 相等 时 为 正三 侧 。 如 图 6-33 所 示 ， 
正 轴 侧 可 以 通过 几 步 分 解 获得 。 如 图 6-33a 所 示 ， 投 影 面 分 别 与 三 个 坐标 交 于 4、B 和 C,， 投 
影 方向 与 投影 面 垂直 。 首 先 ， 把 物体 及 投影 面 绕 》 轴 顺 时 针 旋转 9 角 ， 得 图 6-33b， 再 绕 工 轴 
逆 时 针 旋 转 w 角 ， 得 图 6-33c。 换 句 话说 ， 就 是 将 正 轴 侧 分 为 两 个 绕 坐 标 轴 旋 转 的 处 理 来 完 
成 。 这 样 ， 用 齐 次 坐标 来 描述 得 : 








处 理 中 的 代数 运算 及 几何 





图 6-32 ” 正 轴 侧 正 方 体 侧 投影 
引 等 轴 侧 b) 正二 侧 “) 正三 侧 


投影 方向 





引 中 日 
图 6-33 ” 正 轴 侧 投影 变换 分 解 示意 图 
正 轴 侧 投影 平面 b 投影 面 绕 y 轴 顺 时 针 旋 9 角 e) 投 影 面 绕 x 轴 顺 时 针 旋转 op 角 


人 


做 绕 了 轴 及 x 轴 的 旋转 

cosp 0 sinp 0 人 0 有 AN 
工 =TT = 1 0 0l0 6 sing 0 
-sin 0 cosm 0||0 -sing cosg 0 
0 用 1 八 0 0 0 

cosO -sinpsing sinpcosm 0 

矶 0 cosO sing 0 

村 -sinp -cospsing cospcosb 0 

0 0 0 1 


在 z 轴 方 向 上 做 正 投影 ， 就 得 到 正 轴 侧 的 投影 变换 矩阵 为 





《6-53) 


《6-54) 





cosO -sinpsing 0 0 
| cosB 0 0 
汉 -sinp -cospsing 0 0 2 
0 0 个 于 
等 轴 侧 的 条 件 是 投影 面 与 三 个 坐标 轴 方 向 的 夹 角 都 相等 ， 于 是 得 到 等 轴 侧 的 投影 变换 矩 
阵 为 
/2 -6/6 0 0 
二 二 0 (6-56) 
-2/2 -6/6 0 0 
0 0 J 


正三 侧 的 条 件 是 投影 与 某 两 个 坐标 轴 之 间 的 夹 角 相 等 。 因 此 ， 正 二 侧 的 投影 变换 矩阵 为 
\2/2 -2/2sing 0 0 

人 0 cosO 革 ) 了 

人 六 二 22sn20 0 

0 0 0 1 


《6-57) 


2 斜 投影 

斜 投影 是 第 二 类 平行 投影 ， 与 正 投影 的 区 别 在 于 投影 方向 与 投影 面 不 垂直 。 斜 投影 将 正 
投影 的 三 视图 和 正 轴 侧 的 特性 结合 起 来 ， 既 能 像 三 视图 那样 在 主 平面 上 进行 距离 和 角度 测 
量 ， 又 能 像 正 轴 侧 那样 同时 反映 物体 的 多 个 面 ， 具 有 立体 效果 。 通 常 选择 投影 面 垂直 于 某 个 
主轴 ， 这 样 对 平行 于 投影 面 的 物体 表面 可 进行 距离 和 角度 的 侧 量 ， 而 对 物体 的 其 他 面 ， 可 沿 
该 主轴 侧 量 距 离 。 

如 图 6-34 所 示 ， 常 用 的 两 种 斜 投影 是 斜 等 出 和 斜 二 侧 。 当 投影 方向 与 投影 平面 成 45? 角 
时 ， 得 到 的 是 斜 等 侧 〈 见 图 6-34a)。 这 时 ， 和 投影 平面 垂直 的 任何 直线 段 ， 其 投影 长 度 不 
变 ， 即 图 6-34a 中 4B = 少 B' 。 当 投影 方向 与 投影 平面 成 arctan 2 的 角度 时 ， 得 到 的 是 斜 二 
侧 〈 图 6-34b)。 这 时 ， 和 投影 平面 垂直 的 任何 直线 ， 其 投影 长 度 为 原来 的 一 半 ， 即 图 6-34b 
中 4B=24B' 。 














图 6-34 斜 投影 
a) 斜 等 人 出 b) 斜 二 侧 
有 了 斜 投影 的 概念 ， 下 面 来 看 斜 投影 变换 。 设 投影 平面 为 芭 ' 平 面 ， 投 影 方向 与 投影 平 





面 的 夹 角 为 K ， 投 影 线 和 z 轴 所 组 成 的 平面 与 xz 面 的 两 面 角 为 6 。 如 图 6-35 所 示 ， 点 
已 Co ,0) 是 点 P(0,0,z) 在 投影 平面 上 的 斜 投影 ， 设 其 大 小 为 上 ， 于 是 有 : 


zx =kcos8 DJ) = 


KsinD 大 =ztanw 〈6-58) 


记 





图 6-35 ” 斜 投影 变 换 
对 于 空间 任意 一 点 CCcm%z) ， 在 投影 平面 上 的 斜 投影 O'(x,y0) 的 坐标 可 以 直接 得 出 ， 


即 
并 人 有 
加 =Jz +y=ztanxsinB + 
斜 投影 变换 矩阵 为 
1 0 0 0 
0 0 0 
本 tancwcosB tanwsinB 0 0 人 
0 0 总 于 
其 中 ， 斜 等 侧 的 投影 方向 与 投影 平面 的 夹 角 w = 45" ，tan wx =1， 所 以 变换 矩阵 为 
1 人 
上 IEONEERISO 
oo osp snp o 0 (6-61) 
0 0 


对 于 斜 二 侧 ， 投影 方向 与 投影 平面 的 来 角 =arctan， tanw =112 三 0.5 ， 所 以 变换 矩 
陈 为 


1 0 00 
0 4 :二 庆 
Tsz= - 
mm |0.ScosB 0.Ssing 0 0 和 
0 和 人 


图 6-36 给 出 了 一 个 单位 立方 体 在 区 "平面 上 的 几 种 斜 投影 。 那 些 倾斜 线 是 与 :平面 垂直 
的 立方 体 棱 边 的 投影 ， 它 们 与 坐 轴 轴 x 的 夹 角 ， 就 是 图 6-36 中 的 投影 倾角  ， 且 一 般 取 45” 
和 30*。 可 以 看 到 ， 同 一 个 物体 以 不 同 的 投影 方式 进行 投影 后 ， 所 得 到 的 图 形 是 不 相同 的 。 









































图 6-36 单位 立方 体 的 斜 投影 


6.6 ” 灰 度 级 插值 


在 进行 图 像 的 比例 缩放 、 旋 转 及 复合 变换 等 ， 原 始 图 像 的 像素 坐标 (zx,y) 为 整数 ， 而 变 
换 后 目标 图 像 的 位 置 坐 标 并 非 整数 ， 反 过 来 也 是 如 此 ， 因 此 ， 在 进行 图 像 的 几何 变换 时 ， 除 
了 要 进行 几何 变换 运算 之 外 ， 还 需要 进行 灰 度 级 插值 处 理 。 常 用 的 灰 度 级 插值 方法 有 三 种 : 
最 近邻 插值 法 、 双 线性 插值 法 和 三 次 内 插值 法 。 


EI 最 近邻 插值 法 ] 
最 近邻 法 插值 是 一 种 简单 的 插值 方法 ， 如 图 6-37 所 示 ， 它 是 通过 计算 与 点 PCx, 罗 ) 临 


近 的 四 个 点 ， 并 将 与 点 PCm,m) 最 近 的 整数 坐标 点 (xz,y) 的 灰 度 值 取 为 Poxo,yo) 点 灰 度 近 似 
值 。 在 Pom,m) 点 各 相 邻 像素 间 灰 度 变化 较 小 时 ， 这 种 方法 是 一 种 简单 快速 的 方法 ， 但 当 








Po,Dm) 点 相 邻 像素 间 灰 度 值 差 异 很 大 时 ， 这 种 灰 度 估 值 方法 会 产生 较 大 的 误差 ， 甚 至 可 能 
影响 图 像 质 量 。 








图 6-37 ”最 近邻 插值 法 插值 示意 图 


[全 双 线 性 插值 法 


双 线 性 插值 法 是 对 最 近邻 法 的 一 种 改进 ， 即 用 线性 内 插 方 法 ， 根 据点 PCxw,) 的 四 个 相 
邻 点 的 灰 度 值 ， 通 过 两 次 插值 计算 出 灰 度 值 f(xu,yo) ， 如 图 6-38 所 示 。 

有 具体 计算 情况 如 下 : 

1) 计算 ww 和。 


处 理 中 的 代数 ; 













JrO+D 


让 


Goeo+D 


旷 
Go+D 


图 6-38 ” 双 线 性 插值 法 


| (6-63) 
硝 = 苞 = 交 
2) 先 根据 ,Cox, 7), 7Cc+12) 插 值 求 Jo 。 
Jo 力 =JGco)+aLGc+b)-AGcO] 56-64) 
3) 再 根据 fx,y+D,Cx+lLy) 插值 求 Joxo,y+D 。 
Jox,y+D=JGoxy+D+axz+Ly+D=-Gocy+D] 《6-65) 


4) 最 后 根据 .F(xo,y) 及 .F(xo,y+DlD 插值 求 .A(xo, mo) 。 


TCDo= no)+DLOoy+D-AOoo,] 
=(-cod-B)7Cc)+cG-P)7GCc+LD)+ 
-cx)67Ccy+D+URaxyz+by+D 
=JCco)+aLAGCC+L 人 -Ac+ELCcy+D-ACcD)]+ 
pau[7Cc+Ly+D+AGoo)-Aocoy+D-ACc+lI] 《6-66) 
式 中 ，x= [xl;y=[Dm] 。 
由 于 双 线 性 插值 法 已 经 考虑 到 了 点 PCxo, 加 ) 的 直接 邻 点 对 它 的 影响 ， 因 此 一 般 可 以 得 到 
令 人 满意 的 插值 效果 。 但 这 种 方法 具有 低 通 滤波 性 质 〈 后 面 将 介绍 )， 使 高 频 分 量 受到 损 
失 ， 使 图 像 细 节 退 化 而 变 得 轮廓 模糊 。 在 某 些 应 用 中 ， 双 线性 插值 的 斜率 不 连续 还 可 能 会 产 
生 一些 不 期 望 的 结果 。 


区 三 次 内 天 人 法 | 


为 了 得 到 更 精确 的 PCox, 加 ) 点 的 灰 度 值 ， 在 更 高 程度 上 保证 几何 变换 后 的 图 像 质量 ， 实 
现 更 精确 的 灰 度 插值 效果 ， 可 采用 三 次 内 插值 法 等 更 高 阶 插值 法 ， 如 三 次 样 条 函数 、 
Legendre 中 心 函 数 和 sin( rex )M mx ) 函 数 等 ， 这 时 既 要 考虑 PCx,m) 点 的 直接 邻 点 对 它 的 影 
响 ， 还 应 考虑 到 该 点 周围 16 个 邻 点 的 灰 度 值 对 它 的 影响 〈 见 图 6-37)。 

根据 连续 信号 采样 定理 可 知 ， 若 对 采样 值 用 插值 函数 *(x) = sin(rxx)/(rx) 进行 插值 ， 当 采 
样 频率 不 低 于 信号 谱 最 高 频率 的 两 倍 时 可 以 准确 地 恢复 原 信号 ， 并 可 准确 地 得 到 采样 点 间 任 











意 点 的 值 。 插 值 函数 sin( re Mrx ) 的 特性 如 图 6-39 所 示 。 





6-39 ”插值 函数 sin( xx )M rer ) 的 特性 
SG = sin(re)/Mrexe) 可 以 采用 以 下 三 次 多 项 式 近似 。 


1-21xP+lxP 国 >1 
sGC914-81x1+51xP-IxzP 2> 亿 >1 (6-67) 
2 国 >2 


采用 插值 函数 sin(rxx)/Mre) ， 可 按 下 述 步骤 插值 算出 F(xu,yo): 


1) 计算 sl+o) 、s(o) 、s(-o) 、sC2-o) 以 及 sl+B)、s(P)、sd0-P)、sC2-D)。 
2) 根据 fxz-LD70oD)7Cz+Ly) 7Cc+2 妨 计算 (xzo,y) 。 
Jo,)=s+a)7Gxz-Ly)+sJ)7Cc 7)+s0-a)FCc+by) 
+s(2 一 CJ7Cz+2, 切 (6-68) 
3) 按 步骤 2) 求 J(xo,y 一 D, Cno,y+D, (xy+2)。 
4) 根据 A(xo,y 一 D, Jo 7Coy+D, Copy+2) 计 算 JCxo,yo)。 
Jo,yo)=sd+DB)7Gooy-D+s(D)JCoD)+s0-D)7GOooy+D 
+s(2 一 B)7Cxo,y+2) (6-69) 
上 式 计 算 过 程 可 用 和 矩 阵 表 示 为 
4=(sd+a) so sd-oa) s2-o)) 


xz-Ly-D ez-l Tc-bhy+D rz-Ly+2) 
= JoD 们 Jocoy+D Jey+2) 

Cr+Ly-D x+ Coc+by+D Foxz+by+2) 

xz+2y7-D zc+27) 7Cc+2y+D xz+2,7+2) 


C=((+D) s(D) s-D) sC2-D) 


EI 灰 度 级 插值 法 的 MATLAB 实现 ] 


如 图 6-40 所 示 ， 图 中 分 别 采用 最 近邻 插值 法 、 双 线性 插值 法 和 三 次 内 插值 法 得 到 的 图 








像 放大 结果 。 其 实现 代码 如 下 : 


Fimread(lenabmp'); 

figureimshow(D) 

XI-imresizethD; % 最 近邻 插值 法 人 ) 
X2=imresize(L1vbilinear); % 双 线性 插值 法 

X3=imresize(L1vbicubic) % 三 次 内 插值 法 

figure,imshow(X1); 

figure,imshow(X2); 

figureimshow(X3) 


从 以 上 三 种 插值 方法 对 图 像 放 大 的 结果 可 以 看 出 ， 采 用 最 近邻 插值 法 的 图 像 中 明显 可 以 
看 块 状 效应 ， 但 对 于 质量 要 求 不 高 的 情况 下 ， 图 像 效 果 还 可 以 接受 ， 双 线性 插值 法 和 


次 内 
插值 法 的 结果 则 没有 块 状 ， 但 双 线性 插值 法 有 些 模 糊 ， 三 次 内 插值 法 的 效果 是 最 好 的 。 





由 


图 6-40 采用 不 同 插值 方法 的 图 像 
a) 原始 图 像 b) 最 近邻 插值 法 ec) 双 线性 插值 法 d) 三 次 内 插值 法 


6-1 为 什么 点 运算 不 会 改变 图 像 内 像素 的 空间 位 置 关系 ? 
6-2 ”图像 相 加 运算 能 消除 图 像 的 加 性 随机 噪声 吗 ? 为 什么 ? 
6-3 ”什么 是 齐 次 坐标 ? 在 图 像 的 几何 变换 中 ， 它 具有 哪些 优点 ? 











6-4 几何 运算 在 数字 图 像 处 理 技术 中 具有 哪些 典型 应 用 


心 


6-5 常用 的 几何 运算 有 哪 几 种 ? 

6-6 ”编写 一 个 程序 以 实现 如 下 功能 : 将 一 个 灰 度 图 像 与 该 灰 度 图 像 经 过 平移 后 〈 边 界 
全 部 填充 为 零 ) 得 到 的 图 像 ， 进 行 相 减 后 再 相 乘 ， 并 显示 和 比较 两 种 操作 带 来 的 不 同 图 像 输 
出 效果 。 

6-7 图 像 旋转 变换 对 图 像 的 质量 有 无 影响 ? 为 什么 ? 

6-8 什么 是 图 像 的 复合 变换 ? 复合 变换 可 以 分 为 几 种 情况 ? 

6-9 设 原 图 像 为 























请 用 最 近邻 插值 法 将 该 图 像 放 大 为 16x16 大 小 的 图 像 。 





第 7 章 图 像 增 强 衣 


经 图 像 信 息 输 入 系统 获取 的 原 图 像 中 通常 都 含有 各 种 各 样 的 噪声 和 畸变 ， 大 大 影响 了 图 
像 的 质量 。 因 此 ， 在 对 图 像 进行 分 析 之 前 ， 必 须 先 对 图 像 质量 进 行 改善 。 通 常 ， 采 用 图 像 增 
强 的 方法 对 图 像 质量 进 行 改善 。 图 像 增强 不 会 考虑 引起 图 像 质量 下 降 的 原因 ， 而 是 将 图 像 中 
感 兴趣 的 特征 有 选择 地 突出 ， 并 衰减 不 需要 的 特征 。 图 像 增强 的 目的 是 为 了 改善 图 像 的 视觉 
效果 ， 提 高 图 像 的 清晰 度 和 工艺 的 适应 性 ， 以 及 便于 人 与 计算 机 的 分 析 主 处 理 ， 以 满足 图 像 
复制 或 再 现 的 要 求 。 

图 像 增强 的 方法 分 为 室 域 法 和 频 域 法 两 类 ， 空 域 法 主要 是 对 图 像 中 的 各 个 像素 点 进行 操 
作 ;， 而 频 域 法 是 在 图 像 的 某 个 变换 域内 对 整个 图 像 进行 操作 ， 并 修改 变换 后 的 系数 ， 如 传 里 
叶 变 换 、DCT 变换 等 的 系数 ， 然 后 再 进行 反 变换 ， 便 可 得 到 处 理 后 的 图 像 。 

当然 ， 在 图 像 增强 的 过 程 中 ， 总 是 以 对 某 一 部 分 信息 的 强调 和 另 一 部 分 信息 的 损失 为 代 
价 的 。 因 而 总 是 在 要 求 不 降低 图 像 质量 的 前 提 下 ， 对 图 像 进行 处 理 来 改善 图 像 质量 。 但 是 ， 
目前 在 图 像 增强 方面 还 没有 统一 的 质量 评价 标准 ， 即 缺乏 从 图 像 外 观 的 角度 进行 主 、 客 观 评 
判 的 数学 量度 ， 所 以 图 像 增强 手段 还 有 待 于 更 深入 的 研究 。 下 面 将 对 这 一 章 展 开学 习 。 


7.1 灰 度 变换 增强 


灰 度 变换 增强 是 根据 某 种 目标 条 件 ， 按 一 定 变换 关系 逐 点 改变 原 图 像 中 每 一 个 像素 点 的 
灰 度 值 的 方法 ， 即 设 原 图 像 像 素 的 灰 度 值 为 刀 = f(x,) ， 处 理 后 图 像 像素 的 灰 度 值 为 
六 =8g(cy)， 则 灰 度 增强 可 表示 为 




















Jox)=7TsCo 
D=T(D) 


通过 变换 ， 达 到 对 度 增强 的 效果 。 当 灰 度 变换 关系 D' =T(D) 确 定 后 ， 则 确定 了 一 个 具 
体 的 灰 度 增强 方法 。 D' =T(D) 通常 是 一 个 单 值 函数 。 


国 辐 俯 表 及 其 统计 特性 


1. 像素 的 选择 

MATLAB 7.0 图 像 处 理工 具 箱 提供 了 两 个 指定 像素 信息 的 函数 。 

1) pixval( ) 函 数 : 交互 式 显示 像素 的 数值 ， 也 可 以 显示 两 个 像素 间 的 欧 几 里 德 距离 。 
2) impixel() 函 数 :返回 被 选择 像素 或 像素 集合 的 数据 值 ， 可 通过 输入 参数 定义 像素 坐标 。 
以 下 命令 行 说 明了 impixel( ) 函 数 的 使 用 方法 。 


了 


[C, R, P]-impixel(X, MAP) 














其 中 ，X 表示 输入 图 像 ，MAP 为 索引 色 图 像 的 调 色 板 〈 当 图 像 为 索引 色 图 像 时 才 有 此 
参数 )，C 表示 指定 像素 的 颜色 ，R 和 P 表示 像素 的 坐标 。 如 果 在 输入 图 像 参数 后 面 给 出 两 
个 指定 的 像素 坐标 的 向 量 ， 则 impixelO 函 数 将 返回 指定 像素 的 灰 度 ;如 果 调 用 impixel0 函 数 
时 没有 指定 参数 ， 则 系统 将 自动 选择 位 于 当前 坐标 轴 中 的 图 像 。 在 交互 式 下 ， 选 择 完毕 后 按 
《Enter》 键 ， 函 数 将 返回 被 选 像素 的 颜色 数据 。 以 下 程序 代码 说 明了 该 函数 的 操作 情况 。 











imshow canoe:tif 
vals=impixel 

vals= 

0.2902 0.2588 0.1922 
05176 0 0 
0.3882 0.3882 0.2902 


显示 图 形 效果 如 图 7-1 所 示 。 





图 7-1 获取 像素 值 示 意图 


2. 线段 上 像素 灰 度 分 布 的 计算 和 绘制 

如 果 需 要 计算 并 绘制 图 像 中 一 条 或 多 条 线段 上 的 所 有 像素 灰 度 值 ，MATILAB 7.0 图 像 处 
理工 具 箱 提供 的 improfile0) 函 数 可 以 实现 该 功能 。 调 用 该 函数 时 ， 可 以 使 用 端点 坐标 作为 输 
入 参数 来 定义 线段 ， 也 可 以 使 用 鼠标 交互 式 地 定义 线段 。 非 交互 式 improfile0) 函 数 的 调用 格 
式 如 下 : 

@C=improfile(L, XiYi 

其 中 ，I 为 输入 图 像 ，XiO0 和 Yi 是 两 个 向 量 ， 用 来 指定 线段 的 端点 ， 输 出 为 线段 各 点 的 
灰 度 或 颜色 值 。 如 果 improfile() 函 数 不 输 入 任何 参数 ， 那 么 当 鼠 标 位 于 图 像 中 时 会 变 为 十 字 
形 ， 可 以 通过 鼠标 来 定义 线段 的 端点 。 单 击 “ 返 回 ” 按 钮 后 ，improflleO) 函 数 将 在 一 个 新 图 
形 窗口 中 显示 所 得 的 线段 灰 度 值 的 分 布 情况 ， 如 图 7-2 所 示 。 






人 fitsread(solarspectra .fts); 
imshow(LD); 
improfile 





衣 和 





图 7-2 ”线段 上 的 像素 灰 度 分 布 图 
图 像 。b) 像素 灰 度 分 布 曲 线 
图 7-3 所 示 是 对 RGB 图 像 进 行 以 下 操作 后 显示 的 结果 : 


imshow peppers.png 
improfile 

















图 7-3 RGB 图 像 线段 灰 度 分 布 图 
避 原始 图 像 ”bj) 像素 灰 度 分 布 曲线 


3 图像 等 高 线 
在 MATLAB 7.0 图 像 处 理工 具 箱 中 还 可 以 用 imcontour() 函 数 来 显示 灰 度 图 像 的 等 高 线 。 
该 函数 与 MATLAB 7.0 中 的 contour(O) 函 数 类 似 ， 不 同 的 就 是 imcontour() 函 数 可 以 自动 进行 





坐标 
用 方法 。 


， 使 输出 图 像 的 方向 和 外 观 与 图 像 吻合 。 以 下 程序 代码 示例 说 明了 该 函数 的 使 


I=imread(rice.png); 
imshow(D) 
figure,imcontour(D) 


执行 程序 代码 后 效果 如 图 7-4 所 示 。 














a) 原始 图 像 b) 等 高 线 图 


4. 统计 摘要 

此 外 ， 还 可 以 使 用 图 像 处 理工 具 箱 中 的 mean20 函 数 、std20) 函 数 和 corr20 函 数 ， 对 图 像 
准 统计 特性 进行 计算 。 

@ mean2: 计算 矩阵 元 素 的 平均 值 

@ std2: 计算 矩阵 的 标准 偏差 

@ corr2: 计算 两 个 矩阵 的 相关 系数 

5 区 域 属 性 度量 

在 MATLAB 7.0 中 可 以 用 regionprops() 函 数 来 计算 图 像 的 区 域 属性 。 这 些 属 性 包括 测量 








指定 图 像 区 域 的 面积 、 质 心 、 边 框 等 。regionprops() 函 数 调用 方式 如 下 : 


BW=imread(text.png); 
L=bwlabel(BW); 
stats=regionprops(L,all); 
Stats(23) 


得 到 的 图 像 属 性 统计 结果 为 


ans = 
Area: 48 
Centroid: [121.3958 15.8750] 
BoundingBox: [118.5000 8.5000 6 14] 
Subarrayldx: {[9 10 11 12 13 14 15 16 17 18 19 2021 22] [119 120 121 122 123 124]} 
MajorAxisLength: 15.5413 
MinorAxisLength: 5.1684 
Eccentricity: 0.9431 
Orientation: -87.3848 
ConvexHull: [10x2 double] 
ConvexImage: [14x6 logical] 
ConvexArea: 67 
Image: [14x6 logical] 
FilledImage: [14x6 logical] 
FilledArea: 48 
EulerNumber: 1 





Extrema: [8x2 double] 
EquivDiameter: 7.8176 
Solidity: 0.7164 

Extent: 0.5714 
PixelldxList: [48xl double] 
PixelList: [48x2 double] 
Perimeter: 35.3137 





国 园 直接 灰 皮 变换 | 


比 度 不 足 等 整 端 ， 使 人 眼 在 观看 图 像 时 视觉 效果 很 差 。 灰 度 变换 就 是 在 图 像 采 集 系统 中 对 图 


像 像 素 进行 修正 ， 使 整 幅 图 像 成 像 均匀 。 


灰 度 变换 可 以 分 为 3 种 : 线性 变换 、 分 段 线性 变换 和 非 线性 变换 。 灰 度 变换 可 以 使 图 像 


动态 范围 加 大 ， 图 像 对 比 度 扩展 、 图 像 清 晰 、 特 征明 显 ， 是 图 像 增 强 的 重要 手段 。 


1 灰 度 线性 变换 


若 六 =7(D) 是 一 个 线性 单 值 函 数 、 则 由 它 确定 的 灰 度 变换 称 为 灰 度 线性 变换 ， 简 称 线 


若 图 像 谈 度 值 乙 = (xy 的 可 能 值 域 为 [Di,D] ， 如 图 7-5 所 示 是 一 种 妆 '- 刀 的 曲线 


正 斜 率 的 线性 变换 ， 其 表达 式 为 








D= 凡 =-De -ppp ) 
六 一 mim 
D 
网 以 
} 
1 
| 
Di 刘 陋 下 25 二 
FF 忆 D，D 
) b) 


图 7-5 灰 度 线性 变换 
引 灰 度 倒置 b) 局 部 斜率 变换 


具体 变换 时 ， 将 图 像 中 每 个 像素 的 灰 度 值 根 据 变换 曲线 进行 映射 。 


下 面 是 灰 度 倒置 线性 变换 的 程序 示例 ， 其 效果 如 图 7-6 所 示 。 


elc; 

clear all; 
Timread(peppers.png'):; 
colormap:imshow(D); 

%% 设 置 图 像 倒 置 参 数 
j=imadjust(L[0 1],[1 0].1.5); 
% 显 示 倒 置 后 的 图 像 
figure;subimage() 





人 入 








图 7-6 灰 度 倒置 结果 


a 引 原始 图 像 b) 灰 度 倒置 后 的 图 像 


2 分 段 线性 变换 

分 段 线性 变换 是 将 图 像 的 值 域 分 成 多 个 值 域 并 进行 不 同 线性 变换 的 一 种 算法 。 采 用 分 段 
线性 变换 ， 可 根据 变换 要 求 ， 压 缩 一 部 分 灰 度 区 间 ， 扩 展 为 另外 一 部 分 灰 度 区 间 。 其 变换 表 
达 式 为 





= 一 一 (D-D)+D De[D,D] (7-3) 
万 -万 , 
六 = 有 - 呈 CD-DO+D De[D.,Di] (7-4) 


尹 
分 段 线 性 变换 既 可 以 用 多 段 折线 构成 一 个 单位 函数 ， 又 可 逼近 一 条 曲线 。 同 时 ， 经 过 这 
种 变换 以 后 ， 可 使 万 关心 的 图 像 细 节 的 灰 度 范围 得 以 扩展 ， 增 强 其 对 比 度 : 同时 ， 又 使 不 关 
心 的 图 像 细 节 所 处 的 灰 度 范围 得 以 压缩 ， 降 低 其 对 比 度 。 值 和 的 是 ， 采 用 这 种 分 段 线性 
变换 ， 变 换 前 后 整 幅 图 像 总 的 灰 度 范围 是 不 变 的 ， 如 图 7-7 所 
3. 灰 度 的 非 线性 变换 
灰 度 的 非 线性 变换 简称 非 线 性 变换 ， 是 指 由 ' =T(D) 这样 一 个 非 线性 单 值 函数 所 确定 









的 灰 度 变换 。 这 里 主要 讨论 实际 应 用 中 经 常 使 用 的 对 数 变换 。 对 数 变换 常用 来 扩展 低 值 灰 
度 ， 压 缩 高 值 灰 度 ， 这 样 可 以 使 低 值 灰 度 的 图 像 细 节 更 容易 看 清 ， 从 而 达到 图 像 增 强 的 效 





果 。 对 数 变换 曲线 如 图 7-8 所 示 ， 其 表达 式 为 








局 局 
D 
忆 
恋 
疡 全 已 全 
忆 忆 . Di 也 D。 D。， 六 D 
图 7-7 分 段 线性 变换 图 7-8 对 数 变换 曲线 


D'=C*log(0+|Dh) 《3 对 
式 中 ，C 为 尺度 比例 常数 。 
利用 图 7-8 中 的 对 数 变换 曲线 ， 对 图 7-9a 中 的 原始 图 像 进行 变 换 ， 可 得 到 如 图 7-9b 所 





下 的 变换 效果 ， 其 变换 程序 说 明 如 下 : 


[=imread(treesif:colormap 
imshow(D 

J=double(D; 

J=-45+log(J+1); 

[uint8(J); 
figure,subimage(J) 








基 


可 日 
图 7-9 对 数 变换 前 、 后 的 图 像 效果 图 


a) 原始 图 像 ”b) 变换 后 的 图 像 





7.1.3| 直方 图 灰 度 变 
有 多 种 方法 可 以 实现 图 像 亦 度 变换 ， 其 中 最 常用 的 就 是 直方 图 灰 度 变换 的 方法 ， 下 面 将 
寺 论 直方 图 灰 度 变换 方法 
图 像 的 直方 图 是 图 像 的 重要 统计 特征 ， 可 以 认为 是 图 像 亦 度 分 布 密度 函数 的 近似 。 通 常 
图 像 的 灰 度 分 布 密度 函数 与 像素 所 在 的 位 置 有 关 。 设 图 像 在 点 (x,) 处 的 灰 度 分 布 密度 函数 
为 p(z;xz7)， 那 么 图 像 的 灰 度 密度 函数 为 


< 和 Pest (7-6) 





重 








式 中 ， 忆 是 图 像 的 定义 域 ，$ 是 区 域 刀 的 面积 。 一 般 来 讲 ， 要 得 到 精确 的 图 像 灰 度 分 布 密度 
函数 比较 困难 ， 所 以 实际 中 用 图 像 的 直方 图 来 代替 。 直 方 图 是 一 个 离散 函数 ， 它 表示 数字 图 
像 每 一 灰 度 级 与 该 灰 度 级 出 现 频率 的 对 应 关系 。 设 一 幅 数 字 图 像 的 像素 总 数 为 Y， 有 上 个 灰 
度 级 ， 具 有 第 个 灰 度 级 的 灰 度 六 的 像素 共用 个 。 则 第 上 个 灰 度 级 出 现 的 概率 为 
2K 
N 

在 MATLAB 7.0 图 像 处 理工 具 箱 中 ， 直 接 提供 了 imhistO) 函 数 来 计算 和 显示 图 像 的 直方 
图 ， 格 式 为 

@ imhist(Ln): 对 灰 度 图 像 

@ imhistCX, map): 对 索引 色 图 像 





及 = 大 = 041…25-1 07) 

















量 [counts, x]=imhist(…) 


其 中 ，I 代表 灰 度 图 像 ，n 为 指定 的 灰 度 级 数目 ， 默 认 值 为 256， 


直方 图 数据 向 量 和 相应 的 色彩 值 向 量 。 
灰 度 直方 图 程序 代码 如 下 ， 操 作 效 果 如 图 7-10 所 示 。 
=imread(cameraman.tif); 


imshow(L[40 255]); 
figureimhist(D) 





图 7-10 灰 度 图 像 与 直方 图 
原始 图 像 b) 直方 图 





由 图 7-10 可 以 看 出 ， 可 以 通过 改变 直方 图 的 形状 来 达到 增强 图 像 对 比 度 的 效果 ， 该 方 


counts 和 x 分 别 为 返回 





法 以 概率 论 为 基础 。 实 际 上 ， 改 变 直方 图 形状 的 常用 方法 就 是 直方 图 的 均衡 化 。 


在 MATLAB 7.0 中 ， 图 像 处 理工 箱 箱 提供 了 对 比 度 调 整 函数 imadjust0)， 用 于 调整 灰 度 


值 或 颜色 图 ， 其 调用 格式 为 
@ J=imadjust(L [low_in] high_in,[low_out high_outl]，7 ) 





将 灰 度 图 像 工 转化 为 图 像 J， 使 值 low_in 到 high_in 与 从 low_out 到 high_out 相 匹配 ， 大 
于 high_in 或 小 于 low_in 的 值 将 被 减 去 ， 即 小 于 low_in 的 值 与 low_out 相 匹 配 ， 大 于 high_in 
0，1]。y 用 来 指定 描述 I 和 JJ 值 关系 曲线 的 形 
状 ，y <1 时 ， 输 入 越 亮 ， 输 出 值 越 加 强 ，y >1 时 ， 输 入 越 亮 ， 输 出 值 越 减 弱 :， 默认 时 


的 值 与 high_out 相 匹 配 。 它 们 的 默认 值 为 


y =1， 表 示 线 性 变换 。 图 7-11 给 出 了 7 值 不 同时 对 应 的 校正 函数 曲线 。 








<1 P1 
top tp 上 top 
ae botom 攻 和 borom 
1 1 1 
low high Tow high Tow high 
可 上 


图 7-11 不 同 y 值 对 应 的 校正 函数 曲线 


al y<1 时 b y=1 时 ec) y>l 时 











下 面 将 通过 示例 来 说 明 imadjust( ) 函 数 的 用 法 。 

在 此 仍然 对 图 7-10 所 示 的 图 像 进行 处 理 ， 程 序 代 码 如 下 ， 其 处 理 结果 如 图 7-12 所 示 。 
对 这 两 幅 图 进行 对 比 ， 可 以 看 出 ， 经 过 变换 后 的 图 像 覆 盖 了 整个 灰 度 范围 ， 而 在 图 像 7-10 刘 
中 ， 灰 度 范围 只 在 40 一 255 之 间 。 








可 bb 
图 7-12 均衡 后 的 图 像 及 其 直方 图 
直 变换 后 的 图 像 。b) 变换 后 图 像 的 直方 图 


imread(cameramanvtif); 
Jimadjust(L.[0.15 0.9].[0 1]); 
imshow(D); 
figureimhist(l.64) 


其 中 ，imadjust( ) 函 数 的 第 二 个 向 量 [0.15，0.9] 指 定 需 要 映射 的 灰 度 值 范围 ， 第 三 个 向 量 
[0 1] 指 定 希 望 映 射 到 的 灰 度 值 范围 ， 即 灰 度 值 0.15 映射 到 输出 图 像 中 的 0， 灰 度 值 0.9 映射 
到 输出 图 像 中 的 1。 

除了 增强 或 减弱 图 像 的 对 比 度 外 ， 还 可 以 对 图 像 的 灰 度 范围 进行 映射 。 以 下 程序 代码 示 
例 就 是 用 imadjust( ) 函 数 将 输入 图 像 的 灰 度 范围 从 [0 51] 映 射 到 [128 255]， 输 出 图 像 如 图 7-13 
所 示 。 








图 7-13 亮 
a) 原始 图 像 

















imread(cameramantif; 
Jimadjust(L[0 0.2],[0.5 1]); 
imshow(D; 


figure,imshow() 
上 述 操作 可 以 大 大 提高 图 像 的 亮度 ， 也 可 使 原始 图 像 亦 暗部 分 的 动态 变化 范围 大 大 增 
加 ， 从 而 使 细节 更 容易 观看 。 
从 上 面 的 例子 可 以 看 出 ， 用 imadjust( ) 函 数 必须 按照 下 面 的 两 个 步骤 进行 : 
1) 观察 图 像 的 直方 图 ， 判 断 灰 度 范围 。 
2) 将 灰 度 范围 转换 为 0 一 1 之 间 的 小 数 ， 使 得 灰 度 范围 可 以 通过 向 量 [low_in high_in] 传 
递 给 函数 。 


此 外 ， 


可 选 参数 对 图 像 修 正 的 处 理 效 果 有 很 好 的 改善 ， 如 以 下 程序 代码 示例 ， 仍 假设 
图 像 亦 度 范围 不 变 ， 取 y =0.5， 对 图 7-14a 进行 变换 ， 可 得 到 如 图 7-14b 所 示 | 


的 效果 。 








[Xmap]=imread(treestif); 
I=ind2gray(X,map); 
Jimadjust(L.[].0].0.5); 
figure,imshow(D) 
figurejimshow(J) 





图 7-14 y 修正 前 、 后 的 图 像 
a 原始 图 像 b) 修正 后 的 图 像 





直方 图 均衡 化 是 一 种 使 输出 图 像 直方 图 近似 服从 均匀 分 布 的 变换 算法 ， 其 计算 步骤 如 下 : 
1) 列 出 原始 图 像 的 灰 度 级 万 ,7 = 0 …, 矿 …, 汪 一 1， 其 中 二 是 亦 度 级 的 个 数 。 


2) 统计 各 灰 度 级 的 像素 数目 万 ,7 = 0 江 一 1。 





3) 计算 原始 图 像 直 方 图 各 灰 度 级 的 频 度 PCUD= 世 ， 了 =01 玉江 -1 ， 其 中 姑 为 原 
始 图 像 总 的 像素 数目 。 
上 
4) 计 算 累 计 分 布 函数 CD= 2.P(])， 二 和 和 一 
癌 








5) 应 用 以 下 公式 计算 映射 后 的 输出 图 像 的 灰 度 级 8 ，i= 0.1……,P-1， 忆 为 输出 
图 像 亦 度 级 的 个 数 : 
8 =INT[(goo 一 Smn)CCA)+Son+0.5] 
式 中 ，INT 为 取 整 符号 。 
6) 统计 映射 后 各 级 灰 度 级 的 像素 数目 万 ，i= 0 


72 计算 输出 图 像 直方 图 已 (g)= 亏 ， i=01… 


8) 用 方 和 8 的 映射 关系 修改 原始 图 像 的 灰 度 级 ， 从 而 获得 直方 图 近似 为 均匀 分 布 的 输 
出 图 像 。 

以 上 8 个 步骤 就 是 实现 直方 图 均衡 化 的 具体 过 程 。MATLAB 7.0 的 图 像 处 理工 具 箱 提供 
了 图 像 直 方 图 均衡 化 的 具体 函数 histeq( )， 其 具体 调用 格式 为 

@ 三 histeq(L hgram) 

@ J=histeq( mn) 

@@ [J,T]=histeq(…) 

@ newmap=histeq(X,map,hgram) 

@@ newmap=histeq(X, map) 

@ [newmap ,T]=histeqCX,…) 

其 中 ， 前 面 两 行 命令 是 对 灰 度 图 像 而 言 ， 后 三 行 命令 是 对 索引 色 图 像 而 言 ， 具 体 用 法 可 
参照 前 面 工具 箱 介 绍 。 - 

以 下 程序 代码 示例 说 明了 histeq( ) 函 数 的 用 法 ， 处 理 效 果 如 图 7-15 所 示 。 











图 7-15 图 像 均 衡 化 前 后 比较 
二 原始 图 像 均衡 前 ”b) 原始 图 像 均衡 后 e) 直方 图 均衡 前 ”d) 直方 图 均衡 后 


沁 














imread(foresttify; 
三 histeq(D); 
figure,imshow(D) 


figure'imshow(J) 
figure'imhist(l.64) 
figure,imhist(l,64) 


由 图 7-15 可 知 ， 经 过 直方 图 均衡 化 后 ， 可 以 看 出 图 像 的 细节 成 分 更 加 清楚 了 。 同 时 ， 
也 可 看 出 ， 在 直方 图 调整 之 前 ， 低 灰 度 的 比例 很 大 ， 经 过 直方 图 调整 后 ， 各 灰 度 等 级 的 比例 
更 加 平衡 。 然 而 ， 由 于 直方 图 均衡 没有 考虑 图 像 的 内 容 ， 只 是 简单 地 将 图 像 进行 直方 图 均衡 
化 ， 使 图 像 看 起 来 亮度 过 高 。 
国 国 对 比 永 自 适应 直方 图 均衡 化 | 

在 某 些 应 用 中 ， 可 能 只 需要 对 图 像 的 某 个 部 分 进行 均衡 化 ， 为 此 ， 可 以 用 adapthisteq() 
函数 替代 histeq() 函 数 ， 实 现 对 图 像 进行 对 比 度 自 适 应 直方 化 。histeq0 函 数 作用 整 幅 
图 像 时 ， 可 用 adapthisteq() 函 数 对 图 像 中 的 一 个 区 域 进行 操 作 ， 称 为 切片 ， 则 切片 的 对 比 度 
将 得 到 加 强 ， 这 样 ， 就 可 以 使 输出 区 域 的 直方 图 与 指定 的 直方 图 相 匹配 。 为 了 避免 放大 图 像 
中 噪声 的 对 比 度 ， 可 以 设 定 adapthisteq() 函 数 的 参数 ， 限 制 噪声 的 对 比 度 。 

以 下 程序 代码 示例 说 明了 如 何 利用 adapthisteq0) 函 数 来 调整 图 像 的 对 比 度 问 题 。 如 
图 7-16a 所 示 的 原始 其 对 比 度 比较 低 ， 大 部 分 值 集中 在 一 起 ， 经 过 直方 图 均衡 化 处 
理 ， 可 得 到 如 图 7-16b 所 示 的 效果 ， 均 衡 化 的 直方 图 如 图 7-16c 所 示 。 




















imread(pouttif); 
三 adapthisteq(D; 
figure,imshow(D 
figureimshow(J) 
figure,imhist(1,64) 








图 7-16 自 适 应 直方 图 均衡 化 前 、 后 效果 图 
避 原始 图 像 bj 处 理 后 的 图 像 ”e) 处 理 后 的 直方 图 





去 相关 拉 伸 可 以 增强 图 像 相 关 区 域 的 颜色 ， 可 以 利用 MATLAB 7.0 图 像 处 理工 具 箱 中 








的 decorrstretch() 函 数 实现 去 相关 操作 

为 了 说 明 如 何 利用 该 函数 实现 去 相关 操作 ， 这 里 以 ne 人 
进行 说 明 。 在 本 例 中 ， 图 像 有 7 个 颜色 段 ， 但 在 这 
明了 原 图 像 和 处 理 后 的 效果 








像 为 例 
四 7-17 说 








A=multibandread('littlecoriverlan',[512,512,7]"uint8=>uint8',128,bilv'ieee 
B=decorrstretch(A); 
figure,imshow(A); 





Band',Direct,[3,.2.1])): 





figure,imshow(B) 





司 b) 
图 7-17 图 像 去 相关 拉 伸 前 、 后 的 效果 图 
下 原始 图 像 b) 去 相关 拉 伸 后 的 图 像 


下 面 ， 在 一 个 颜色 带 内 实现 去 相关 和 均衡 化 操作 ， 图 7-18 说 明了 对 图 7-17a 
的 颜色 带 处 理 效果 ， 程 序 代 码 如 下 所 示 : 





Rad Ran 外 





图 7-18 ”处理 前 、 后 颜色 分 散 效果 图 


a 处 理 前 的 颜色 分 散 效果 图 。 b) 处 理 后 的 颜色 分 散 效果 图 


Ra=A(:1);Ga=/ Ba=A(:3) 
figure,plot3(Ra(:),Ga(:),BaC), ;gridCon) 























xlabel(Red (Band 3)); 
ylabel(Green (Band 2)); 
zlabel(Blue(Band 1)); 
Rb=B(:,:,1);Gb=B(:,:,2);Bb: 
figure,plot3(Rb(C),Gb(C),Bb( 
xlabel(Red (Band 3)); 
ylabel0Green (Band 2)); 
zlabel(Blue(Band 1)); 


当然 ， 也 可 以 在 去 相关 拉 伸 后 使 用 线性 对 比 度 拉 伸 ， 读 者 可 以 对 比 对比 度 拉 伸 前 后 的 效 
果 〈 见 图 7-19)。 

imshow(A); 

C=decorrstretch(A,Tol,0.01); 

figure,imshow(C) 








图 7-19 线性 对 比 度 拉 伸 后 的 效果 图 
引 原始 图 像 ”b) 线性 拉 伸 后 的 图 像 


7.2 ”空间 域 滤 波 


通常 情况 下 ， 像 素 的 领域 比 该 像素 要 大 ， 也 就 是 说 这 个 像素 的 领域 中 除了 本 身 以 外 还 包 
含 了 其 他 像素 。 在 这 种 情况 下 ，8g(x, 攻 在 (zx, 攻 位 置 处 的 值 不 仅 取决 于 其 在 该 处 的 值 ， 而 且 
取决 于 以 (x,y) 为 中 心 的 领域 内 所 有 像素 的 值 。 

J 利 用 模板 与 图 像 进 行 卷 积 ， 每 个 楼 









根据 其 特点 ， 
对 傅 里 叶 变换 的 分 析 
据 功能 又 主要 分 成 平滑 滤波 器 和 锐 化 滤波 器 。 平 滑 可 用 低 通 ; 实现 ， 平 滑 的 目的 可 分 为 两 
类 : 一 类 是 模糊 ， 目 的 是 在 提取 较 大 的 目标 前 去 除 太 小 的 细节 或 将 目标 内 的 小 间断 连接 起 来 ; 
另 一 类 是 消除 噪声 。 锐 化 可 用 高 通 滤波 来 实现 ， 锐 化 的 目的 是 为 了 增强 被 模糊 的 细节 。 


器 根 


















0 





结合 这 两 种 分 类 法 ， 可 将 空间 滤波 增强 方法 分 成 4 类 : 
@ 线性 平滑 滤波 器 〈 低 通 ) 


@ 非 线性 平滑 滤波 器 〈 低 通 》 

@ 线性 锐 化 滤波 器 〈 高 通 ) 

@ 非 线性 锐 化 滤波 器 〈 高 通 ) 

空域 滤波 器 的 工作 原理 都 可 借助 频 域 进行 分 析 。 它 们 的 基本 特点 都 是 让 图 像 在 傅 里 叶 空 
间 的 某 个 范围 的 分 量 受到 抵制 ， 而 让 其 他 分 量 不 受 影响 ， 从 而 改变 输出 图 像 的 频率 分 布 ， 达 
到 图 像 增 强 的 目的 。 在 图 像 增强 中 用 到 的 空间 滤波 器 主要 有 两 类 ; 

平滑 〈 低 通 ) 滤波 器 : 它 能 减弱 或 消除 傅 里 叶 空间 的 高 频 分 量 ， 但 不 影响 低频 分 量 。 因 
页 应 图 像 中 的 区 域 边缘 等 灰 度 值 具有 较 大 较 快 变化 的 部 分 ， 滤 波 器 将 这 些 分 量 滤 








锐 化 《高 通 ) 滤波 器 : 它 能 减弱 或 消除 傅 里 叶 空间 的 低频 分 量 ， 但 不 影响 高 频 分 量 。 
为 低频 分 量 对 应 图 像 中 灰 度 值 缓慢 变化 的 区 域 ， 因 而 与 图 像 的 整体 特性 ， 如 整体 对 比 度 和 平 
均 灰 度 值 等 有 关 ， 将 这 些 分 量 滤 去 可 使 图 像 锐 化 。 

空域 滤波 器 都 是 利用 模板 卷 积 ， 主 要 步骤 是 : 

1) 将 模板 在 图 中 漫游 ， 并 将 模板 中 心 与 图 中 某 个 像素 位 置 重合 。 

2) 将 模板 上 的 系数 与 模板 下 对 应 的 像素 相 乘 。 

3) 将 所 有 乘积 相 加 。 

4) 将 模板 的 输出 响应 赋 给 图 中 对 应 模板 中 心 位 置 的 像素 。 

下 面 重点 介绍 MATLAB 中 如 何 具 体 实现 图 像 的 平滑 和 锐 化 ， 以 及 此 方法 在 工程 中 的 应 
用 实例 。 














1. 线性 平滑 滤波 
线性 低 通 滤波 器 是 最 常用 的 线性 平滑 滤波 器 。 实 现 这 种 滤波 的 方法 也 称 为 领域 平均 法 。 
领域 平均 法 是 一 种 局 部 空间 域 处 理 的 算法 ， 这 种 方法 的 基本 思想 是 用 几 个 像素 灰 度 的 平均 值 
来 代替 每 个 像素 的 灰 度 。 假 定 有 一 幅 Nx N 个 像素 的 图 像 fF(x,y) ， 平 滑 处 理 后 得 到 一 幅 图 
像 g(x,)。8(xz,7) 由 下 式 决 定 : 
sc- 二 2 jw (7-8) 


式 中 ，xy= 012,…,N-1; 8 是 (xy) 点 领域 中 点 的 坐标 的 集合 ， 但 其 中 不 包括 (六 芒 点; 
AM 是 集合 内 坐标 点 的 总 数 。 式 〈7-8) 说 明 ， 平 滑 后 的 图 像 8S(x,)) 中 的 每 个 像素 的 灰 度 值 均 
由 ， 含 在 (x, ?的 预定 领域 中 的 fx, y) 的 几 个 像素 的 灰 度 值 的 平均 值 来 决定 。 一 种 常见 的 平 
滑 算 法 是 将 原 图 像 中 一 个 像素 的 灰 度 值 和 它 周围 邻近 8 个 像素 的 灰 度 值 相 加 ， 然 后 求 得 的 平 
均值 〈 除 以 9) 作为 新 图 像 中 该 像素 的 灰 度 值 。 我 们 用 如 下 方法 来 表示 该 操作 : 


下 和 
让 1 
2 






(7-9) 





刘 














中 间 的 黑 点 表示 该 元 素 为 中 心 元 素 ， 即 该 个 元 素 是 要 进行 处 理 的 元 素 ， 同 理 可 得 5xs 的 


模板 ， 如 下 所 示 ， 
| 

汪 由 芭 ， 
二 11111 避 
于 ， 人 (7-10) 
所 和 7 

通常 模板 不 允许 移出 边界 ， 因 此 处 理 后 的 图 像 会 比 原 图 像 小 。 对 于 边界 上 无 法 进行 模板 
操作 的 点 ， 我 们 的 做 法 是 复制 原 图 像 的 灰 度 值 ， 不 再 进行 任何 其 他 的 处 理 。 

另外 ，Wiener 滤波 器 也 是 经 典 的 线性 降 噪 滤波 器 。Wiener 滤波 的 思想 是 20 世纪 40 年 
代 提 出 来 的 ， 是 一 种 在 平稳 条 件 下 采用 最 小 方 均 误差 准则 得 出 的 最 佳 则 ， 该 方法 就 是 
寻找 一 个 最 佳 的 线性 滤波 器 ， 使 得 方 均 误差 最 小 。 其 实质 是 解 维 纳 - 霍 夫 〔Wiener Hoof) 方 
程 。 


Wiener 滤波 器 首先 估计 出 像素 的 局 部 矩阵 均值 和 方差: 




















1 
府 居 一 一 一 a(mlL72) | 
三 放 : 
人 (7-12) 
NM 


ae 


刀 是 图 像 中 每 个 像素 Nx M 的 领域 ， 利 用 Wiener 滤波 器 估计 出 其 灰 度 值 : 


E 





Blz2)=A+ 人 二 (aoln2) 一 0 (7-13) 





2 


式 中 ， 妆 是 整 幅 图 像 的 方差 。 它 根据 图 像 的 局 部 方差 来 调整 滤波 器 的 输出 ， 当 局 部 方差 大 
时 ， 滤 波 器 的 效果 较 弱 ， 反 之 滤波 器 的 效果 较 强 ， 是 一 种 自 适应 滤波 器 。 

2. 线性 平滑 滤波 器 的 MATLAB 应 用 

1) 用 MATLAB 7.0 图 像 处 理工 具 箱 中 提供 的 imfilterO 函 数 实 现 SxS 领域 平均 运算 。 程 
序 代码 如 下 : 


clear all; 
=imread(Fximagevchildbmpy; 
Jimnoise(Lvsalt & pepper.0.02); 
h=ones(5.5)/25; 

D=imfilter(J'b); 
figure,imshow(D); 
figure,imshow(I2) 


采用 领域 平均 法 对 图 7-20a 中 的 图 像 进行 处 理 后 的 结果 如 图 7-20b 所 示 。 可 以 看 出 经 过 
领域 平均 处 理 后 ， 图 像 的 噪声 得 到 了 抑制 ， 但 图 像 变 得 相对 模糊 了 。 








可 划 
图 7-20 ”5x5 领域 平均 运算 得 到 的 平滑 图 像 


引 有 嗓 声 的 图 像  b) 5x5 领域 平均 运算 后 的 图 像 
2) Wiener 滤波 实现 降 噪 的 过 程 ， 程 序 代码 如 下 : 


clear all; 
=imread(Fximagelena bmpy); 
figureimshow(D); 

K1=wiener2(L[3.3]); %3x3Wiener 滤波 
K2=wiener2(L[5,5]); %5x5Wiener 滤波 
K3=wiener2(L.[7.7]); %7x7Wiener 滤波 
figure,imshow(K1); 








figure,imshow(K2); 
figureimshow(K3); 


星 序 执行 后 效果 如 图 7-21 所 示 。 





图 7-21 Wiener 滤波 法 实现 降 噪 
引 原始 图 像 ”bj)3x3Wiener 滤波 c) 5<5Wiener 滤波 d7x7Wiener 滤波 


MATLAB OO 





3 非 线性 平滑 滤波 器 

中 值 滤波 是 一 种 去 除 噪 声 的 非 线性 处 理 方法 ， 是 由 Turky 在 1971 年 提出 的 。 其 基本 原 
理 是 把 数字 图 像 或 数字 序列 中 一 点 的 值 用 该 点 的 一 个 领域 中 各 点 值 的 中 值 代替 。 中 值 的 定义 
如 下 : 一 数组 症 ,xx ， 把 严 个 数 按 值 的 大 小 顺序 排列 于 下 : 疝 乏 和 区 基 入 和 其 


2 /为 奇 数 
了 = med{ 和 芭 , 为 = (7-14) 


1 


了 称 为 序列 ,2 ,32 的 中 值 。 把 一 个 点 的 特定 长 度 或 形状 的 领域 称 为 窗口 。 在 一 
维 情形 下 ， 中 值 滤波 器 是 一 个 含有 奇数 个 像素 的 滑动 窗口 ， 窗 口 正 中 间 那 个 像素 的 值 用 窗口 
内 各 像素 值 的 中 值 代替 。 设 输入 序列 为 pe,ie 太 ，7 为 自然 数 集合 或 子 集 ， 窗 口 长 度 为 ，， 
则 滤波 器 输出 为 


风 =medlo}=medfe er (7-15) 


式 中 ，is7; xx=(a-D/2。 
很 容易 将 中 值 滤波 的 概念 推广 到 二 维 ， 此 时 可 以 利用 某 种 形式 的 二 维 窗口 。 设 


Lo 7)E 三 } 表 示 数 字 图 像 各 点 的 灰 度 值 ， 滤 波 窗口 为 A 的 二 维 中 值 滤波 可 定义 为 


芒 =meditoj=medlosrns( se4GPDe (7-16) 


- 维 中 值 滤波 可 以 取 方 形 ， 也 可 以 取 近似 圆 形 或 十 字形 。 

中 值 滤波 是 非 线性 运算 ， 因 此 对 于 随机 性 质 的 噪声 输入 ， 数 学 分 析 是 相当 复杂 的 。 由 大 
量 实验 可 得 ， 对 于 零 均 值 正 态 分 布 的 噪声 输入 ， 中 值 滤波 输出 与 输入 噪声 的 密度 分 布 有 关 ， 
输出 噪声 方差 与 输入 噪声 密度 函数 的 平方 成 反比 。 

对 随机 噪声 的 抑制 能 力 ， 中 值 滤波 性 能 要 比 平均 值 滤波 差 些 ， 但 对 于 脉冲 干扰 来 讲 ， 特 
别 是 脉冲 宽度 较 小 ， 相 距 较 远 的 罕 脉 冲 ， 中 值 滤波 是 很 有 效 的 。 

4 非 线性 平滑 滤波 器 的 MATLAB 应 用 

下 例 对 含有 椒盐 噪声 的 图 像 实现 中 值 滤波 处 理 〈 见 图 7-22)。 











clearall; 

=imread(F:image\lena.bmp)); 

figure,imshow(D; 

Ti=imnoise(Lsalt & pepper,0.06); % 加 噪 
K1=medfilt2(L.[3,3]); % 使 用 3X3 模板 完成 中 值 滤波 
K2=medfilt2(L.[5.5]); % 使 用 SX 5 模板 完成 中 值 滤波 
K3=medfilt2(L[7.7]); % 使 用 7X7 模板 完成 中 值 滤波 
figurejimshow(KT); 








figureimshow(K2); 
figureimshow(K3); 





由 
图 7-22 调用 函数 medfilt2 中 值 滤波 
a 原始 图 像 bj3X3 模板 中 值 滤波 e) 5X5 模板 中 值 涉 波 “d)7X 7 模板 中 值 滤波 





由 以 上 处 理 结果 可 以 看 出 ， 中 值 滤波 器 不 像 均 值 滤波 那样 ， 
使 图 像 的 边界 模糊 ， 这 也 是 中 值 滤波 器 受 欢迎 的 主要 
于 两 个 要 素 : 领域 空间 范围 ， 中 值 计算 中 所 涉及 的 像素 数 。 ， 小 于 中 值 滤波 器 面 
积 一 半 的 亮 或 暗 的 物体 基本 上 会 被 滤 掉 ， 而 较 大 的 物体 则 几乎 会 原封 不 动 地 保存 下 来 ， 因 
此 中 值 的 空间 尺寸 必须 根据 面临 的 问题 来 进行 调整 。 较 简单 的 模板 是 Nx N 的 方形 
(这 里 N 通 常 是 奇数 )， 计算 时 用 到 所 有 的 CN 个 ) 像 。 另 外 ， 读 者 也 可 以 使 用 稀 踊 
分 布 的 模板 来 节省 空间 。 


它 在 衰减 噪声 的 同时 不 会 
的 效果 依赖 















让 号 和 人 有 和 人 
人 本 
domair=|1 11 1 1 donmaainr=|0 0 1 0 0 (7-17) 
0 1 站 看 是 
人 ji 


这 里 仅 举 两 例 ， 例 中 都 是 对 于 5x 5 的 模板 来 说 的 ， 当 
况 选 取 不 同 大 小 的 模板 ， 来 达到 更 好 的 应 用 效果 。 
需要 说 明 的 是 ， 中 值 滤波 只 是 排序 统计 滤波 中 的 一 种 ， 即 用 当前 窗 是 的 的 
值 代 蔡 当 前 的 值 。 在 实现 中 也 可 以 用 其 他 规定 点 的 值 代 蔡 ， 在 MATILAB 中 这 





实际 应 用 中 可 以 根据 不 同 的 情 


在 中 间 的 

















用 ordfilt2( A,order domain) 函 数 来 实现 ， 分 别 举 如 下 例 ; 

B=ordfil2(A，1，ones (3,3)) 实 现 3x3 的 最 小 值 滤波 器 ， 因 为 它 取 全 1 模板 中 排 在 最 小 位 
置 处 的 那个 像素 。 

B= ordfil2(A, 1.[010; 101; 010]) 的 输出 是 每 个 像素 的 东 、 西 、 南 、 北 四 个 方向 相 邻 
像素 灰 度 的 最 小 值 ， 因 为 它 取 4- 邻 域 的 模板 中 排 在 最 小 位 置 处 的 那个 像素 





在 图 像 识 别 中 ， 需 要 有 边缘 鲜明 的 图 像 ， 即 图 像 锐 化 。 图 像 锐 化 的 目的 是 为 了 突出 图 像 
的 边缘 信息 ， 加 强 图 像 的 轮廓 特征 ， 以 便于 人 眼 的 观察 和 机 器 的 识别 。 因 此 ， 从 图 像 增强 的 
目的 看 ， 它 是 与 图 像 平滑 相反 的 一 类 处 理 。 

图 像 中 对 象 的 边缘 像素 都 是 变化 较 大 的 地 方 。 而 边缘 模糊 、 线 条 不 均 是 由 于 减少 了 边缘 
亮度 差异 的 缘故 。 从 数学 观点 来 看 ， 检 查 图 像 某 区 域内 灰 度 的 变化 就 是 微分 的 概念 ， 因 此 可 
以 通过 微分 的 方法 进行 图 像 锐 化 。 根 据 微分 方法 是 否 线性 ， 可 将 图 像 锐 化 分 为 线性 锐 化 和 非 
人 下 面 分 别 介绍 。 

。 线 性 锐 化 滤波 

人 这 种 滤波 器 的 中 心 系数 都 是 正 的 ， 而 周围 
的 系数 都 是 负 的 。 对 3x3 的 模板 来 说 ， 典 型 的 系数 取 值 是 

[0-10，-14-10-10 


事实 上 这 是 拉 普 拉 斯 算 子 。 
拉 普 拉 斯 算 子 是 0 对 被 运算 的 图 像 它 满足 各 向 同性 的 要 求 ， 这 对 于 图 像 
增强 是 非常 有 利 的 。 拉 普 拉 斯 算 子 的 表达 式 是 





避 
vsy C7-18) 

对 于 离散 函数 ./(Gi, 7)， 其 差分 形式 是 
VCD=Ae7GD+A2AG 07-19) 
这 里 Ar7G, 六 和 Ay27G 记 是 7G 记 在 x 方 向 和 ?方向 的 二 阶 差分 所 以 离散 函数 的 


拉 普 拉 斯 算 子 的 表达 式 为 
VCGPD=AG+LD+AG-LPD+AGC7HD+AG7-D-47G 放 
系数 取 值 是 
[0-10; -18-1; 0-10] 
1) 在 MATLAB 中 可 通过 调用 filter2( ) 函 数 和 fspecial( ) 函 数 来 实现 ， 代 码 如 下 : 


clear all; 
II=imread(F:image\lena.bmp); 
% 将 图 像 矩阵 转化 为 double 型 
Il=double(I1D; 


像 增 强 





hl= 人 pecial(taplacian; 
1I2=filter2(hl.00); % 拉 氏 变换 
figure,imshow(I1,[]); 
13=I1-D; 


figureimshow(13,[]); 他 


处 理 前 后 的 图 像 如 图 7-23 所 示 。 





图 7-23 拉 普 拉 斯 图 像 
引 原始 图 像 b) 拉 普 拉 斯 






5 的 图 像 





2) 下 面 为 线性 锐 化 滤波 后 面 的 边缘 检测 的 例子 ， 程 序 代码 如 下 ， 运 行 结 果 如 图 7-24 所 示 。 
% 下 面 是 利用 拉 普 拉 斯 算 子 对 模糊 图 像 进 行 增强 
=imread(trees-tif); 
I=double(D; % 转 换 数 据 类 型 为 double 双 精 度 型 
figure,imshow(L[); 
H=[0101-41.010]; 。 %% 拉 普 拉 斯 算 子 
J=conv2(LHvsame; % 用 拉 普 拉 斯 算 子 对 上 





像 进 行 二 维 卷 积 运算 





% 增 强 的 图 像 为 原始 图 像 减 去 拉 普 拉 斯 算 子 滤波 的 图 像 
本 = 
figure,imshow(K,[D) 





b) 
图 7-24 拉 普 拉 斯 算 子 对 模糊 图 像 进 行 增强 
a 原始 图 像 b) 拉 普 拉 斯 算 子 对 图 像 的 锐 化 


< 和 19 

















运行 结果 如 图 7-24 所 示 。 由 图 可 见 ， 图 像 模糊 的 部 分 得 到 了 锐 化 ， 边 缘 部 分 得 到 了 增 
强 ， 边 界 更 加 明显 。 但 图 像 显 示 清 楚 的 地 方 ， 经 滤波 后 发 生 了 失真 ， 这 也 是 拉 普 拉 斯 算 子 增 
强 的 一 大 缺点 。 

2 非 线 性 锐 化 滤波 

对 一 幅 图 像 施加 梯度 模 算 子 ， 可 以 增强 灰 度 变化 的 幅度 ， 因 此 我 们 可 以 采用 梯度 模 算 子 





作为 图 像 的 锐 化 算 子 。 此 方法 也 是 最 常用 的 非 线性 锐 化 滤波 方法 ， 而 且 由 数学 知识 可 以 知 
道 ， 梯 度 模 算 子 具 有 方向 同性 和 位 移 不 变性 ， 这 正 是 我 们 所 希望 的 。 
对 于 离散 函数 .A(Gi 7 力 ， 利 用 差分 来 代替 微分 。 


- 阶 差 分 的 定义 为 


AxJGD=JGD-7G-L7 (7-20) 
AJGPD=7C7D-7G7-D (7-21) 
为 此， 梯度 的 定义 为 
二 
lel=[Awye 六 -AAAG7D 下 57-22) 


为 了 运算 简便 ， 实 际 中 采用 梯度 模 的 近似 形式 ， 如 |As7G7+|AAG7 、 
max(Axy7G 让 ,|Ay7G,7 轴 、 max|AG, 访 -Amm 等 。 另 外 ， 还 有 一 些 常用 的 算 子 ， 如 
Roberts 算 子 和 Sobel 算 子 。 
利用 Sobel 算 子 对 图 像 滤 波 ， 程 序 代码 如 下 : 
TI=imread(eighttif); 
H= 人 pecial(sobel); % 选 择 Sobel 算 子 
figure,imshow(D); 
filter2(H.D; % 卷 积 运算 
figure,imshow(O) 


运行 结果 如 图 7-25 所 示 。 











图 7-25 ”Sobel 算 子 对 图 像 锐 化 的 结果 


a) 原始 图 像  b) 进行 Sobel 算 子 后 的 效果 


7.3 ” 频 域 滤波 增强 








的 滤波 与 空间 域 滤波 一 样 可 以 通过 卷 积 运算 实现 。 
限定 8 人 7 表示 函数 7Gi, 7 与 线性 移 不 变 算 子 Ai 妃 进 行 卷 积 运算 的 结果 ， 即 
SC)= co)G@HCD) (7-23) 
因此 可 得 
CoD=FGovHoc) (7-24) 





式 中 ，G、 忆 、 万 分 别 是 函数 gG7) 、7G7) 、Ap 放 的 傅 里 叶 变换 ， 瑟 (xy) 称 为 滤波 器 函 
数 ， 也 可 以 称 为 传递 函数 。 在 图 像 增强 中 ， 由 于 待 增强 的 图 像 函数 ji, 7) 是 已 知 的 ， 因 此 ， 
Fdcy) 可 由 图 像 的 傅 里 叶 变换 得 到 。 

实际 应 用 中 ， 首 先 需 要 确定 瓦 (xw,v) ， 然 后 就 可 以 求 得 Gy) ， 再 对 Go) 进行 傅 里 叶 
逆 变 换 ， 即 可 得 到 增强 的 图 像 gb,7) 。8g(G,7 可 以 突出 Fi,7) 的 某 一 方面 的 特征 信息 。 若 
通过 囊 (wy) 增强 Fwyv) 的 高 频 信 息 ， 如 增强 图 像 的 边缘 信息 等 ， 则 为 高 通 滤波 ， 如 果 增 强 
Fw 妇 ) 的 低频 信息 ， 如 对 图 像 进行 平滑 操作 等 ， 则 为 低 通 滤波 。 频 域 滤波 方法 的 系统 框图 如 
图 7-26 所 示 ， 其 滤波 处 理 过 程 可 以 分 为 以 下 三 个 步骤 ; 


Je DFT 赤 Re) Rn) Go 由) IDFT 赤 SC) 
( 训 肯 全 时 鬼 机 ) (传递 函数 ) (让 居 虹 仆 ct) 2 


图 7-26 频 域 滤波 系统 框图 


1) 对 原始 图 像 Ai, 7 进行 傅 里 叶 变 换 得 到 天 cov) 。 
2) 将 Fw) 与 滤波 器 函数 万 (uv) 进行 卷 积 运算 得 到 Gu v) 。 
3) 对 G(s 刀 进行 傅 里 叶 逆 变 换 ， 即 可 求 出 增强 图 像 g(z, 户 。 


加 二 直 下 
图 像 从 空间 域 变换 到 频 域 后 ， 其 低频 分 量 对 应 图 像 中 灰 度 值 变化 比较 缓慢 的 区 域 ， 而 高 
频 分 量 则 表示 了 图 像 中 物体 的 边缘 和 随机 噪声 信息 。 低 通 滤波 器 的 功能 是 通过 滤波 器 函数 万 
减弱 或 抑制 高 频 分 量 ， 保 留 低频 分 量 。 因 此 ， 低 通 滤波 器 与 空域 中 的 平滑 滤波 器 一 样 可 以 消 
除 图 像 中 的 随机 噪声 ， 削 弱 边 缘 效应 ， 起 到 平滑 图 像 的 作用 。 

常用 的 低 通 滤波 器 包括 理想 低 通 滤波 器 、 巴 特 沃 斯 低 通 滤波 器 、 指 数 低 通 滤波 器 和 梯形 
低 通 滤波 器 等 多 种 类 型 。 本 章 只 讨论 径 向 对 称 的 零 相 移 滤波 器 函数 ， 几 种 常用 的 低 通 滤波 器 
形式 如 下 。 
1. 理想 低 通 滤波 器 
二 维 的 理想 低 通 滤波 器 的 传递 函数 为 
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0 Do)> 孙 


式 中 ，D 是 一 个 非 负 整 数 ， 即 理想 低 通 滤波 器 的 截止 频率 ，D(x,v) 是 从 点 (zw,V) 到 频 域 原 
点 的 距离 ， 即 
Duo)=AVa2+ 了 2 〈7-26) 


MATLAB ee 








因此 ， 瑟 (wy) 、&M 、Y 组 成 了 理想 低 通 滤波 器 的 三 维 图 形 。 图 7-27a、b 分 别 为 理想 低 
通 滤波 器 的 三 维 透视 图 和 二 维 剖面 示意 图 ， 理 想 低 通 滤 波 器 的 作用 是 将 小 于 ZD, 的 频率 ， 即 
以 疡 为 半径 的 圆 内 的 所 有 频率 成 分 可 以 无 衰减 通过 ， 而 大 于 Z 的 频率 则 被 完全 截止 不 能 通 

理论 上 给 出 的 滤波 器 函数 〈 包 括 高 通 滤波 ) 形式 都 是 以 坐标 原点 径 向 对 称 的 ， 而 对 于 一 
个 数字 图 像 所 对 应 的 N x N 频 域 矩阵 ， 坐 标 原 点 是 该 矩形 的 中 心 ， 因 而 滤波 器 理想 特性 一 般 
如 图 7-27 所 示 。 理 想 低 通 滤波 器 的 数学 定义 形式 非常 简洁 ， 其 平滑 作用 的 物理 意义 非常 明 
人 但 在 图 像 处 理 过 程 中 会 产生 比较 严重 的 模糊 与 振 铃 现 象 。 因 为 ， 根 据 傅 里 叶 变 换 的 性 

， 若 刀 (wy) 这 理想 的 矩形 特性 ， 那 么 其 逆 变 换 hx,y) 的 特性 会 产生 无 限 的 振 铃 特性 ， 
妇 与 fx,7) 卷 积 运算 后 将 给 目标 图 像 g(x, 刀 造成 模糊 与 振 铃 现 象 。 而 且 Z 越 小 ， 这 种 
现象 越 明显 

此 外 在 截止 频率 已 处 垂直 窟 目的 理想 低 通 滤波 器 只 能 通过 计算 机 模拟 实现 ， 无 法 采用 


电子 器 件 实现 。 
人 au) 
Di， Don 
本 


图 7-27 理想 低 通 滤波 器 的 三 维 透视 图 和 二 示意 图 
理想 低 通 滤波 器 的 三 维 透视 图 b) 理想 低 通 滤波 器 的 二 维 剖面 示意 图 


2.， 巴特 沃 斯 低 通 滤波 器 
巴特 沃 斯 (Butterworth) 低 通 滤 波 器 的 传递 函数 为 


本 《7-273 
全 [到 | 


0 


瓦 (wyv)= 


式 中 ，Z 为 截止 频率 ;7 为 滤波 器 的 阶 次 。 和 理想 低 通 滤 波 器 一 样 ， 巴 特 沃 斯 低 通 滤 波 器 
的 特性 曲线 同样 为 三 维 图 形 ， 其 剖面 示意 图 如 图 7-28 所 示 。 一 般 情况 下 ， 当 (xwy) 下 降 到 
最 大 值 的 2 时 ， D(w v) 为 截止 频率  。 在 实际 应 用 中 ， 有 时 也 取 瓦 (zx,y) 下 降 至 最 大 值 
的 27/2 时 的 Dr,v) 作为 截止 频率 Du 。 这 时 ， 其 传递 函数 为 


人 (7-28) 


-2 


Po 











巴特 沃 斯 低 通 滤波 器 又 称 为 最 大 平坦 滤波 器 ， 其 通 带 与 阻 带 之 间 的 过 渡 比 较 平坦 。 
此 ， 巴 特 沃 斯 低 通 滤波 器 的 特点 是 : 在 通过 频率 与 截止 频率 之 间 没 有 明显 的 不 连续 性 ， 不 会 


出 现 “ 振 铃 ”效应 ， 其 效果 好 于 理想 低 通 滤波 器 。 攻 


屿 ww) 


0 1 2 辽 DuevyD 
图 7-28 “巴特 沃 斯 低 通 滤波 器 的 剖面 示意 图 
3. 指数 低 通 滤波 器 
指数 低 通 滤波 器 的 传递 函数 为 





瑟 (0ey)= .长 (7-29) 


一 般 情况 下 ， 取 太 (xwy) 下 降 至 最 大 值 的 1/2 时 的 DGxv) 为 截止 频率 Du 。 其 剖面 示意 
图 如 图 7-29 所 示 。 与 巴特 沃 斯 低 通 滤波 器 一 样 ， 指 数 低 通 滤波 器 从 通过 频率 到 截止 频率 之 
间 具 有 一 段 平 滑 的 过 渡 带 ， 也 没有 明显 的 不 连续 性 。 

4 梯形 低 通 滤波 器 


梯形 低 通 滤波 器 的 传递 函数 为 
1 Dev< 旋 
有 (on=12eae0= 吕 记 <pows (7-30) 
肋 - 已 
0 Doy> 已 


梯形 低 通 滤波 器 的 剖面 图 示意 如 图 7-30 所 示 ， 从 图 中 可 以 看 出 ， 在 疡 ,的 尾部 包含 有 一 
部 分 高 频 分 量 〈 Di > Du )， 因 而 ， 结 果 图 像 的 清晰 度 较 理想 低 通 滤波 器 有 所 改善 ,“ 振 铃 ” 
效应 也 有 所 减弱 ， 应 用 时 可 调整 记 的 值 ， 即 能 达到 平滑 图 像 的 目的 ， 又 可 以 使 图 像 保 持 足 
够 的 清晰 度 。 
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图 7-29 指数 低 通 滤波 器 的 剖面 示意 图 图 7-30 梯形 低 通 滤波 器 的 剖面 示意 图 





根据 DFT 变换 的 性 质 和 频谱 的 分 布 特点 ， 二 维 DFT 变换 的 频谱 主要 集中 在 低频 处 ， 因 
此 ， 在 设计 和 应 用 低 通 滤 波 器 时 ， 一 定 要 注意 二 维 DFT 的 频谱 特点 ， 即 图 像 能 量 集中 在 频 
谱 图 的 频谱 中 心 位 置 。 


5. 频 域 实现 图 像 平 滑 滤波 
各 种 频 域 低 通 滤波 器 的 MATLAB 实现 ， 程 序 代码 如 下 : 





[hmap]-imread( Fimagevlenabmpy; 
noisy=imnoise(L'gaussian,0.01); 
[M.N]-size(D; 

F=ffh2(noisy); 

人 shift(F); 

Deut=100; 

DO0=150; 


forv=LN 
Duv)=sqrttu'2+v'2); 
BUTTERHCu,v)=I(I+(sqrtC2)-DUD*(D(uyMDcut^2) 
EXPOTH(u,V)=exp(log(1/sqrt(27)*(D(u.vVDcuty'2); 
证 D(uV<D0 
THPFH(uv)=1; 
elseif D(u,V)<=D1 
THPEH(u,v)=(D(uwvw-DIMDO-D1); 
else 
THPFH(uV)=0; 
end 
end 
end 
BUTTERG=BUTTERH.*F; 
BUTTERfiltered=ifft2(BUTTERG); 
EXPOTG=EXPOTH.*F; 
EXPOTfiltered=iff2(EXPOTG); 
THPFG=THPFH.*F; 
THPFfiltered=ifft2(THPFG); 
figureiimshow(noisy); 
figure,imshow(BUTTERfiltered.map) 
figure,imshow(EXPOTfiltered,map) 
figure,imshow(THPFfiltered,map); 


程序 运行 结果 如 图 7-31 所 示 。 





图 7-31 频 域 低 通 滤波 举例 


al 高 斯 噪声 后 的 图 像 ”b) 巴特 沃 斯 低 通 滤 波 后 的 图 像  e) 指数 低 通 滤波 后 的 图 像 d) 梯形 低 通 滤波 后 的 图 像 
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式 中 ， 疡 ,是 一 个 非 负 整 数 ， 即 理想 高 通 滤 波 器 的 截止 
点 的 距离 ， 即 





;， Du) 是 从 点 (uv) 到 频 域 原 


Do) =Aa2+T (7-32) 

图 7-32 中 给 出 了 理想 高 通 滤波 器 滤波 特性 的 剖面 ， 其 作用 与 理想 低 

反 ， 它 将 小 于 疡 的 频率 〈 半 径 为 Du 的 圆 内 ) 的 所 有 频率 完全 截止 ， 而 大 于 忆 的 直 
外 的 频率 ) 则 可 以 全 部 无 误 减 通过 。 理 想 高 通 滤 波 器 也 不 能 通过 电子 器 件 实现 。 
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2.， 巴特 沃 斯 高 通 滤波 器 
巴特 沃 斯 高 通 滤波 器 的 传递 函数 为 


-一 一 一 〈《7-33) 
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瑟 (xy)= 





式 中 ，ZD 为 滤波 器 的 截止 频率 7 为 滤波 器 的 阶 次 。 巴 特 沃 斯 高 通 滤波 器 滤波 性 能 的 前面 


示 


过 





意图 如 图 7-33 所 示 。 截 止 频率 疡 的 取 值 方法 与 巴特 沃 斯 低 通 滤波 器 相似 ， 该 滤波 器 在 通 


率 与 截止 频率 之 间 也 没有 明显 的 不 连续 性 ， 图 像 增强 后 ,“ 振 铃 ”效应 不 明显 。 
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图 7-32 ”理想 高 通 滤波 器 的 剖面 示意 图 图 7-33 巴特 沃 斯 高 通 滤波 器 的 剖面 示意 图 


与 巴特 沃 斯 低 通 滤波 器 类 似 ， 一 般 情 况 下 ， 取 瓦 (xy) 下 降 至 最 大 值 的 1/2 时 的 Du,y) 


为 截止 频率 Do 。 在 实际 应 用 中 ， 有 时 也 取 瓦 (zx,y) 下 降 至 最 大 值 的 Vz72 时 的 D(x,v) 作为 截 
止 频率 Di 。 这 时 ， 其 传递 函数 形式 为 


1 





着 人 人 (7-34) 
rr- 
3. 指数 高 通 滤波 器 
指数 高 通 滤波 器 的 传递 函数 为 
碳 (Coy)= 5 (7-35) 


其 截止 频率 Du 的 取 值 与 指数 低 通 滤波 器 相似 ， 其 特性 曲线 剖面 示意 图 如 图 7-34 所 示 。 
4 梯形 高 通 滤波 器 
梯形 高 能 滤波 器 的 传递 函数 为 


1 Do)< 记 
让 太 六 2 一， 夯 志 DJ 葬 (7-36) 
家 二 
0 Dev<DD 


如 图 7-35 所 示 为 梯形 高 通 滤波 器 滤波 的 剖面 示意 图 。 





Mu) Hu 





0 


1 2 3 DuvyDu 站 2 刘 


图 7-34 ”指数 高 通 滤波 器 的 剖面 示意 图 图 7-35 梯形 高 通 滤波 器 的 剖面 示意 图 


带 通 和 带 阻 滤波 器 





在 图 像 处 理 中 ， 有 时 需要 增强 的 信息 或 抑制 的 信息 既 不 是 图 像 中 的 高 频 成 分 也 不 是 低频 
成 分 ， 而 是 在 一 个 有 限 的 频带 范围 内 。 这 时 ， 无 论 是 低 通 滤波 器 还 是 高 通 滤波 器 都 不 能 完 
满足 使 用 需求 ， 而 需要 采用 带 通 或 带 阻 滤波 器 。 

1.， 带 通 滤波 器 

所 谓 带 通 滤波 器 是 指 允许 一 定 频率 范围 内 的 信号 通过 而 阻止 其 他 频率 范围 内 的 信号 通过 
的 滤波 器 。 理 想 带 通 滤波 器 的 传递 函数 为 

0 De)< 记 -二 





末 (oWJ=41 已- 于 <DoDs 记 + 《7-377 
0 Den)< 记 + 


式 中 ，Ww 为 通 带宽 度 ; 疡 为 通 带 中 心 频率 D(xu,v) 表示 从 点 (ty) 到 频带 中 心 (wo,vo) 的 


距离 ， 即 
De)=AJG -zxoD2+C 一 天 (7-38) 


理想 带 通 滤波 器 的 剖面 示意 图 如 图 7-36 所 示 。 
2 带 阻 滤波 器 
带 阻 滤波 器 是 指 可 以 对 一 定 频率 范围 内 的 信号 进行 完全 衰减 ， 而 容许 其 他 频率 范围 内 的 
信号 通过 的 滤波 器 。 理 想 带 阻 滤波 器 的 传递 函数 为 
De)<w 
古 (=40 Wi<Dom<w (7-39) 
1 Duomsm 





式 中 ，w,w 为 带 阻 宽度 ，D(xu,v) 表 示 从 点 (av) 到 带 阻 中 心 (ko,vo) 的 距离 ， 即 


De) = -zxo7+C-vo (7-40) 


理想 带 阻 滤波 器 的 剖面 示意 图 如 图 7-37 所 示 。 
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图 7-36 理想 带 通 滤 








域 MATLAB 实现 
如 下 用 频 域 高 通 滤波 法 对 图 像 进 行 增强 。 








imread( Fimagevlena bmp)); 
mnoise(Lgaussian.0.01); 
[MN]=size(D); 
F= 值 2(noisy); 
fshift(F); 
Deut=100; 
D0=250; 
DI1=150; 
foru=1M 
forv=LN 
Du,v)=sqrt(uc2+vA2); 


[ma 
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加 H 


二 Dux) 
图 7-37 理想 带 阻 滤波 器 的 剖面 示意 图 


程序 代码 如 下 


BUTTERH(u,v)=IMI+(sqrt(C2)-D*(DcuyD(u,v))^2); 
EXPOTH(u,v)=exp(log(1/sqrt(2))*(DcuVD(u,v))^2); 


证 D(u,v)<D1 
THPFHCuVF=0; 
elseif D(uV)<=D0 


THPEHCuv=(D(uv)-DIMDOo-DD; 


else 
THPFH(uv)=-1; 
end 
end 
end 
BUTTERG=BUTTERHL*F; 
BUTTERfiltered=ift2(BUTTERG); 
EXPOTG=EXPOTH.*F; 
EXPOTfiltered=ifft2(EXPOTG); 
THPFG=THPFH.*F; 
THPFfiltered=iff2(THPFG):; 
figure'imshownoisy); 
figure,imshow(BUTTERfiltered) 
figure,imshow(EXPOTfiltered) 
figureiimshow(THPFfiltered); 


星 序 代 码 执行 后 的 结果 如 图 7-38 所 示 。 





图 7-38 ” 频 域 高 通 滤波 举 例 


引 加 入 高 斯 噪声 后 的 图 像 ”b) 巴特 沃 斯 高 通 滤波 后 的 图 像 ec) 指数 高 通 滤波 后 的 图 像 ”d 梯形 六 


7.4 同 态 增 晰 


同 态 增 晰 是 一 种 在 频 域 中 将 图 像 动态 范围 进行 压缩 并 将 图 像 对 比 度 进行 增强 的 方法 。 它 
基于 图 像 的 成 像 模 型 。 一 幅 图 像 fr(x,?) 可 以 用 它 的 照明 分 量 ix, 妇 及 反射 分 量 r(x, 让 来 表 
示 ， 即 





滤波 后 的 图 像 





JJ)=iCcDJrOcD) (7-41) 
根据 这 个 模型 可 用 下 列 方法 对 两 个 分 量 分 别 进行 滤波 ， 如 图 7-39 所 示 。 
了 外 FFT | Huo 中 FFT- sp 上 






































图 7-39 同 态 增 晰 流程 图 
1) 先 对 式 〈7-41) 取 对 数 ，In f(x, =lni(x,y)+lnr(xr,y)。 
2) 对 式 〈7-41) 取 傅 里 叶 变换 ，F(wv)= 7T(ww)+RGowv)。 
3) 用 一 个 频 域 函 数 末 (wv) 处 理 Fldw ， 瑞 (ovy) Foy) = 末 aon) Tom + 
五 (lv) Rev) 。 
4) 反 变 换 到 空间 域 ， 入 (Co 切 = 态 (xz, 了 )+ 及 (xy) 。 
5) 将 4) 中 的 式 子 两 边 取 指 数 ，g(x2) = exp| 入 Co]|=exp| 力 Co ylexp 





帮 Cc 划 |， 令 











MATLAB Ra 





ix =explzCx,y] 
万 Cx) =explz (cy]| 
则 
8Co 人 =iCc)mGc 
为 (x,y) 是 处 理 后 的 反射 分 量 。 

幅 图 像 分 量 一 般 是 在 空间 缓慢 变化 的 ， 而 反射 分 量 在 不 同 物体 的 交界 处 是 急剧 
变化 的 ， 这 个 特征 使 人 们 有 可 能 把 一 幅 图 像 取 对 数 后 的 傅 里 叶 变换 的 低频 分 量 和 照射 分 量 联 
系 起 来 ， 而 把 反射 分 量 与 高 频 分 量 联系 起 来 。 以 上 特性 表明 我 们 可 以 设计 一 个 对 传 里 叶 变换 
的 高 频 分 量 和 低频 分 量 影响 不 同 函数 瓦 (wx,y) ， 处 理 结果 会 使 像素 灰 度 的 动态 范围 或 
图 像 对 比 度 得 到 增强 。 如 图 7-40 所 示 ， 低 频段 被 压缩 ， 高 频段 得 到 增强 ， 结 果 是 同时 压缩 
了 图 像 的 动态 范围 并 增加 了 图 像 各 部 分 之 间 的 对 比 度 。 如 图 7-41 所 示 为 同 态 增 晰 滤波 增强 
效果 。 


式 中 ，Ce 攻 是 处 理 后 的 照射 分 量 
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图 7-40 同 态 增 晰 滤波 函数 的 剖面 示意 图 





图 7-41 同 态 增 晰 滤波 增强 效果 


a) 光照 


7.5 “彩色 图 像 增强 


前 面 介绍 的 图 像 增 强 技术 都 是 对 灰 度 图 像 进行 处 理 的 ， 而 且 生成 的 结果 也 是 灰 度 图 像 。 本 
节 的 彩色 增强 技术 处 理 的 对 象 虽 然 也 是 灰 度 图 像 ， 但 生成 的 结果 却 是 彩色 图 像 。 众 所 周知 ， 人 





原因 b) 同 态 增 晰 后 的 效果 图 











的 视觉 系统 对 色彩 非常 敏感 ， 人 眼 一 般 能 区 分 的 灰 度 等 级 只 有 二 十 多 个 ， 但 是 能 区 分 有 不 同 亮 


度 、 色 度 和 饱和 度 的 几 千 种 颜色 。 根 据 人 眼 的 这 个 特点 ， 可 将 彩色 用 于 图 像 增 强 中 ， 以 提高 图 
像 的 可 鉴别 性 。 因 此 如 果 能 将 一 幅 灰 度 图 像 变 成 彩色 图 像 ， 就 可 以 达到 图 像 增 强 的 视觉 效果 。 
常用 的 彩色 增强 方法 有 真 彩色 增强 技术 、 假 彩色 增强 技术 和 伪 彩 色 增 强 技术 三 种 。 前 两 种 方法 
着 眼 于 对 多 幅 灰 度 图 像 的 合成 处 理 ， 一 般 是 将 三 幅 图 像 分 别 作为 红 、 绿 、 蓝 三 个 通道 进行 合 
成 。 伪 彩色 增强 技术 与 前 两 者 不 同 ， 它 是 对 一 幅 灰 度 图 像 的 处 理 ， 通 过 一 定 的 方法 ， 将 一 幅 灰 
度 图 像 变 成 一 幅 彩 色 图 像 。 下 面 分 别 对 伪 彩 色 、 真 彩色 和 假 彩 色 增强 技术 进行 详细 论述 。 


有 伪 彩 色 增 强 


伪 彩 色 (Pseudo Coloring) 增 强 是 把 一 幅 黑白 图 像 的 每 个 不 同 灰 度 级 ， 按 照 线性 或 非 线性 
的 映射 函数 ， 变 换 成 不 同 的 彩色 ， 与 彩色 空间 中 的 一 点 相 匹配 ， 得 到 一 幅 彩 色 图 像 的 技术 。 
它 使 原 图 像 细 节 更 易 辨认 、 目 标 更 容易 识别 。 伪 彩色 增强 的 方法 主要 有 以 下 三 种 。 

1. 密度 分 割 法 

密度 分 割 法 也 称 为 强度 分 割 法 ， 是 伪 彩色 增强 中 最 简单 而 又 最 常用 的 一 种 方法 ， 它 是 对 
图 像 的 灰 度 值 动态 范围 进行 分 割 ， 使 分 割 后 的 每 个 灰 度 值 区 间 甚 至 每 个 灰 度 值 本 身 对 应 某 一 
种 颜色 ， 如 图 7-42a、b 所 示 。 具 体 而 言 ， 假 定 把 一 幅 图 像 看 成 一 个 二 维 的 强度 函数 ， 用 于 
一 个 平行 于 图 像 坐标 平面 的 平面 〈 称 为 密度 切割 平面 ) 去 切割 图 像 的 强度 函数 ， 这 样 强度 函 
数 在 分 割 处 被 分 为 上 、 下 两 部 分 ， 即 两 个 灰 度 值 区 间 。 如 果 再 对 每 一 个 区 间 赋 予 某 种 颜色 ， 
就 可 以 将 原来 的 灰 度 图 像 变换 成 只 有 两 种 颜色 的 图 像 。 更 进一步 ， 如 果 用 多 个 密度 切割 平面 
对 图 像 的 强度 函数 进行 分 割 ， 那 么 就 可 以 将 图 像 的 灰 度 值 动态 范围 切割 成 多 个 区 间 ， 每 一 个 
区 间 赋 予 某 一 种 颜色 ， 则 原来 的 一 幅 灰 度 图 像 就 可 以 变 成 一 幅 彩 色 图 像 ， 如 图 7-42 所 示 。 
其 中 ， 图 7-42a 以 立体 方式 给 出 了 密度 分 割 原理 的 立体 图 ， 图 7-42b 是 平面 图 。 特 别 地 ， 如 
果 将 每 一 个 灰 度 值 都 划分 成 一 个 区 间 ， 如 将 8b 灰 度 图 像 划分 成 256 个 区 间 ， 就 是 索引 色 图 
像 ， 从 这 个 意义 上 讲 ， 可 以 认为 索引 色 图 像 是 由 灰 度 图 像 经 密度 分 割 而 成 的 。 
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a) b) 
图 7-42 密度 分 割 原理 图 
a 引 密度 分 割 原理 的 立体 图 b) 密度 分 割 原理 的 平面 图 
如 果 用 W 个 密度 切割 平面 去 切割 图 像 的 强度 函数 ， 则 可 以 得 到 N+1 个 灰 度 值 区 间 ， 
每 一 个 区 间 对 应 一 种 颜色 C; 。 对 于 每 个 像 元 (人 ， 如 果 TEgocE 和 5 ， 则 
gGC0 人 =C，i=12…N ，g0y) 和 xy) 分 别 表 示 变 换 后 的 彩色 图 像 和 原始 灰 度 图 
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像 。 这 样 便 可 以 把 一 幅 灰 度 图 像 变 成 一 幅 伪 彩色 图 像 。 此 法 比较 直观 简单 ， 缺 点 是 变换 出 的 
彩色 数目 有 限 。 
应 当 指出 ， 每 个 灰 度 值 区 间 赋 予 何 种 颜色 ， 是 由 具体 应 用 所 决定 的 ， 并 无 规律 可 言 。 但 
总 的 来 讲 ， 相 邻 灰 度 值 区 间 的 颜色 差别 不 宜 太 小 ， 也 不 宜 太 大 ， 太 小 将 无 法 反映 细节 上 的 差 
异 ， 太 大 则 会 导致 图 像 出 现 不 连续 性 。 在 实际 应 用 中 ， 密 度 切割 平面 之 间 可 以 是 等 间隔 的 ， 
也 可 以 是 不 等 间隔 的 ， 而 且 密 度 切割 平面 的 划分 也 应 根据 具体 的 应 用 范围 和 研究 对 象 而 定 。 
2. 空间 域 灰 度 级 一 彩色 变换 





密度 分 割 法 实质 上 是 通过 一 个 分 段 线性 函数 实现 从 灰 度 到 彩色 的 变换 ， 每 个 像 元 只 经 过 一 
个 变换 对 应 到 某 一 种 颜色 。 与 密度 分 割 法 不 同 的 











0) 
是 ， 空 间 域 灰 度 级 一 彩色 变换 是 一 种 更 为 常用 、 ae 如] 到 红 枪 
比 密度 分 割 法 更 有 效 的 伪 彩 色 增 强 法 。 其 变换 过 。 ye ao 
程 如 图 7-43 所 示 ， 它 是 根据 色 度 学 的 原理 ， 将 二 到 绿 枪 
原始 图 像 flx,y) 中 每 个 像 元 的 灰 度 值 分 别 经 过 AD) 
红 、 绿 、 蓝 三 种 独立 变换 区 CO) 、 歼 0 和 上 一 > 莒 内 上 一 > ma 
刀 O) ， 变 成 红 、 绿 、 蓝 三 基色 分 量 Roy)、 图 7-43， 灰 度 级 一 彩色 变换 过 程 
GOoy) 、BCcy) 分 量 图 像 ， 然后 用 它们 分 别 去 控制 彩色 显示 器 的 红 、 绿 、 蓝 电子 枪 ， 便 可 以 
在 彩色 显示 器 的 屏幕 上 合成 一 幅 彩 色 图 像 。 三 个 变换 是 独立 的 ， 彩色 的 含量 由 变换 函数 7(D)、 
到 GO 和 了 72() 的 形状 而 定 。 但 在 实际 应 用 中 ， 这 三 个 变换 函数 一 般 取 同一 类 的 函数 ， 如 可 以 取 
带 绝对 值 的 正弦 函数 ， 也 可 以 取 线性 变换 函数 。 典 型 的 变换 函数 如 图 7-44 所 示 ， 灰 度 值 范围 
为 [0, 刀 ， 每 个 变换 取 不 同 的 分 段 线性 函数 。 可 以 看 出 ， 最 小 的 灰 度 值 (0) 对 应 蓝 色 ， 中 间 的 
灰 度 值 (Z2) 对 应 绿色 ， 最 高 的 灰 度 值 ( 工 ) 对 应 红色 ， 其 余 的 灰 度 值 则 分 别 对 应 不 同 的 颜 
色 。 其 中 图 7-44a 一 ec 分 别 为 红 、 绿 、 蓝 三 种 变换 函数 ， 而 图 7-44d 是 把 三 种 变换 画 在 同一 张 图 
上 ， 以 便 看 清楚 它们 之 间 的 关系 。 由 图 7-44d 可 见 ， 只 有 在 灰 度 为 零 时 ， 呈 蓝 色 ， 灰 度 为 工 /2 
时 ， 呈 绿色 ， 灰 度 为 二 时 ， 呈 红色 ， 灰 度 为 其 他 值 时 ， 将 由 三 基色 混合 成 不 同 的 色调 。 
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器 是 
图 7-44 典型 的 变换 函数 
加 红色 b) 绿色 c) 蓝 色 dj 红 、 绿 、 昔 三 色 关系 





\ 图 像 增强 





3 频 域 伪 彩 色 增 强 

频 域 伪 彩 色 增强 首先 把 黑白 图 像 从 空间 域 经 傅 里 叶 变换 变 到 频 域 ， 然 后 在 频 域内 
用 三 个 不 同 传递 特性 的 滤波 器 〈 如 高 通 、 带 通 / 带 阻 、 低 通 ) 将 图 像 分 离 成 三 个 独立 的 
分 量 ， 对 每 个 范围 内 的 频率 分 量 分 别 进行 傅 里 叶 逆 变换 ， 得 到 三 幅 代表 不 同 频率 分 量 
的 单 色 图 像 ， 接 着 对 这 三 幅 图 像 作 进一步 的 处 理 〈 如 直方 图 均衡 化 )， 最 后 将 它们 作为 
三 基色 分 量 分 别 加 到 彩色 显示 器 的 红 、 绿 、 蓝 显示 通道 ， 从 而 实现 频 域 的 伪 彩 色 增强 ， 
如 图 7-45 所 示 。 

















让 波 器 1 上 | 信里 时 地 变换 | ->| 进一步 处 理 


让 波 器 2 上 -| 信里 叶 地 变换 | -| 进一步 处 理 
让 法 器 3 上 | 伟 里 叶 闻 变换 | | 进一步 处 理 
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图 7-45 ” 频 域 伪 彩色 增强 原理 图 


75 2 下 和 | 


假 彩 色 (False Coloring) 增强 是 将 一 幅 图 像 或 多 光谱 图 像 映 射 到 RGB 空间 中 心 位 置 上 
的 过 程 。 假 彩色 增强 是 经 常 出 现 的 一 个 操作 过 程 。 例 如 ， 调 节 彩 色 电视 机 的 色调 、 饱 和 度 的 
过 程 实 是 假 彩色 增强 。 又 如 红 光 成 像 设备 拍摄 了 _N 幅 不 同 波段 上 的 图 像 : HGx,7)， 
万 (Coy)， 将 它们 经 过 假 彩色 增强 可 以 再 现 出 可 见 光谱 图 像 ， 其 处 理 函 数 如 下 : 





RD 人 = 天 LA 人 AGO (07-42) 
CC 人 = 无 LA 人 AGO (7-43) 
BC 人 = 天 LA 让 (7-44) 


式 中 ， 及 , 瑟 ,有 瑟 为 映射 函数 ，R(xc y),G(Ccy),B(cy) 为 显示 空间 三 基色 分 量 。 

伪 彩 色 或 假 彩 色 增 强 都 不 改变 图 像 像 素 的 几何 位 置 ， 而 仅仅 改变 其 颜色 。 因 此 ， 可 以 与 
人 眼 的 色觉 特性 相 结合 设计 它们 的 映射 函数 及 ,天 , 柬 ， 提 高 人 眼 对 图 像 的 分 辨 能力 。 该 技 
术 已 被 广泛 应 用 于 融 感 、 医 学 图 像 处 理 中 。 


自然 物体 的 彩色 叫 真 彩色 ， 把 能 真实 反映 自然 物体 本 来 颜色 的 图 像 叫 真 彩色 图 像 。 真 彩 
色 图 像 可 由 彩色 摄像 机 摄制 ， 并 由 彩色 监视 器 近似 复原 。 然 而 ， 在 没有 彩色 摄像 机 的 情况 
下 ， 也 可 以 通过 真 彩色 增强 技术 实现 真 彩色 处 理 。 

任何 一 幅 真 彩色 图 像 可 由 红 、 绿 、 蓝 三 基色 混合 而 成 。 因 此 ， 在 图 像 处 理 过程 中 ， 首 先 
用 加 有 红色 滤 色 片 的 摄像 机 《黑白 摄像 机 ) 摄取 彩色 图 像 ， 图 像 信 号 经 数字 化 送 入 一 块 图 像 
存储 板 存 起 来 ， 再 用 带 有 绿色 滤 色 片 的 摄像 机 摄取 图 像 ， 图 像 信 号 经 数字 化 送 入 第 二 块 图 像 
存储 板 ; 最 后 用 带 有 蓝 色 滤 色 片 的 摄像 机 摄取 图 像 ， 图 像 数 据 存储 在 第 三 块 图 像 存 储 板 内 。 
三 幅 图 像 数 据 准备 好 后 ， 就 可 以 在 系统 的 输出 设备 一 一 彩色 监视 器 上 合成 一 幅 真 彩色 图 像 。 
其 原理 如 图 7-46 所 示 。 
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图 7-46 彩色 图 像 合 成 的 原理 


习题 


7-1 假定 有 64x64 大 小 的 图 像 ， 灰 度 级 为 16 级 ， 概 率 分 布 见 表 7-1， 试 进行 直方 图 均 


衡 化 并 画 出 处 理 前 后 的 直方 图 。 


图 



































表 7-1 
了 从 PC 的 伺 PC 
800 0.195 ms=8/15 150 0.037 
650 0.160 7mo=9/15 130 0.031 
600 0.147 mo=10115 110 0.027 
3 430 0.106 mn=1U15 96 0.013 
mi=4/15 300 0.073 ro=12/15 80 0.019 
5=5/15 230 0.056 rua=13/15 70 0.017 
16r=6/15 200 0.049 Tu=14/15 50 0.012 
rF7115 170 0.041 ] ms=l 30 0.007 














7-2 比较 理想 高 通 滤波 器 与 理想 低 通 滤 汉 

7-3 ”如果 一 幅 图 像 已 经 用 直 
用 直方 图 均衡 化 ， 处 理 结果 会 不 会 更 好 ? 

7-4 比较 理想 低 通 滤波 器 、 巴 特 沃 斯 低 通 滤 浊 

7-5 为 什么 一 般 情 况 下 对 离散 图 像 直方 图 均衡 
化 并 不 能 产生 完全 平坦 的 直方 图 ? 

7-6 已 知 一 幅 图 像 的 灰 度 级 为 8 级 ， 即 〈0， 
1) 之 间 划 分 为 8 个 灰 度 等 级 。 图 像 的 左边 一 半 为 深 灰 
色 ， 其 灰 度 级 为 17， 而 右边 一 色 ， 其 灰 度 级 为 
0， 如 图 7-47 所 示 。 试 对 此 图 像 进行 直方 图 均衡 化 处 
理 ， 并 描述 一 下 处 理 后 图 像 是 一 幅 什么 样 的 图 像 。 


7-7 试 证 明 拉 普 拉 斯 算 子 
























AN 


7-8 什么 是 伪 彩 色 增强 处 理 ? 其 主要 目的 是 什么 ? 





器 的 异同 点 。 
图 均衡 化 方法 进行 了 处 理 ， 那 么 对 处 理 后 的 图 像 再 次 应 


图 7-47 


有 克 | 不 
5 


医 、 指 数 低 通 滤波 器 和 梯形 低 通 滤波 器 。 





第 8 章 图 像 分 割 与 边缘 检测 


图 像 分 割 是 一 种 重要 的 图 像 分 析 技 术 。 在 对 图 像 的 研究 和 应 用 中 ， 人 们 往往 仅 对 图 像 中 
的 某 些 部 分 感 兴趣 ， 这 些 部 分 常常 被 称 为 目标 或 前 景 〈 其 他 部 分 称 为 背景 )， 它 们 一 般 对 应 
图 像 中 特定 的 、 具 有 独特 性 质 的 区 域 。 这 里 的 独特 性 质 可 以 是 像素 的 灰 度 值 、 物 体 轮 廓 曲 
线 、 颜 色 和 纹理 等 。 为 了 识别 和 分 析 图 像 中 的 目标 ， 需 要 将 它们 从 图 像 中 分 离 提取 出 来 ， 在 
此 基础 上 才 有 可 能 进一步 对 目标 进行 测量 和 对 图 像 进行 利用 。 图 像 分 割 就 是 指 图 像 分 成 各 具 
特性 的 区 域 并 提取 出 感 兴趣 目标 的 技术 和 过 程 。 

一 般 的 图 像 处 理 过 程 如 图 8-1 所 示 。 从 图 中 可 以 看 出 ， 图 像 分 割 是 从 图 像 预 处 理 到 图 像 
识别 和 图 像 分 析 理 解 的 关键 步骤 ， 在 图 像 处 理 中 占据 重要 的 位 置 。 一 方面 它 是 目标 表达 的 基 
础 ， 对 特征 测量 有 重要 的 影响 ， 另 一 方面 ， 图 像 分 割 以 及 基于 图 像 分 割 的 目标 表达 、 特 征 提 
取 和 参数 测量 等 将 原始 图 像 转化 为 更 为 抽象 、 更 为 紧凑 的 形式 ， 使 得 更 高 层 的 图 像 识 别 和 图 
像 分 析 理 解 成 为 可 能 。 
































1。 图像 答 入 |。 图像 颈 处 理 图 像 分 割 
sg 光电 变换 | | 图 像 增强 阔 值 分 割 
] | | ma 过 检 而 | | 
人 图 像 编码 区 城 信 制 | ; 





RE 沁 旺 2 


图 像 识别 上 HH 图 像 分 析 理解 全 
解释 














图 8-1 一 般 的 图 像 处 理 过 程 
图 像 分 割 的 方法 已 有 上 千 种 ， 每 年 还 有 许多 新 方法 出 现 ， 典 型 而 传统 的 图 像 分 割 方法 可 
以 分 为 基于 闪 值 的 方法 、 基 于 边缘 的 方法 和 基于 区 域 的 分 割 方法 等 ， 本 章 将 对 这 些 典 型 的 图 
像 分 割 方法 加 以 介绍 。 


8.1 灰 度 阔 值 法 
国 辐 玫 你 分 虽 基 本 后 理 | 


图 像 分 割 是 根据 图 像 的 组 成 结构 和 应 用 需求 将 图 像 划分 成 若干 个 互 不 相交 的 子 区 域 的 过 
程 。 这 些 子 区 域 是 某 种 意义 下 具有 共同 属性 的 像素 的 连通 集合 。 如 不 同 目标 物 体 所 占 的 图 像 
区 域 、 前 景 所 占 的 图 像 区 域 等 。 连 通 是 指 集合 中 任意 两 点 之 间 都 存在 着 完全 属于 该 集合 的 连 
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刘 








通路 径 。 
对 于 数字 图 像 而 言 ， 如 图 8-2 所 示 ， 连 通 包括 4 连通 和 8 连通 两 种 情况 。4 连通 是 指 从 
区 域内 一 点 出 发 ， 可 通过 4 个 方向 ， 即 上 、 下 、 左 、 右 移动 的 组 合 ， 在 不 超过 区 域 的 前 提 


下 ， 到 达 区 域内 的 任意 像素 点 ;8 连通 是 指 从 区 域内 一 点 出 发 ， 可 通过 左 、 右 、 上 、 下 、 左 
上 、 右 上 、 左 下 、 右 下 这 8 个 方向 的 移动 组 合 ， 到 达 区 域内 的 任意 像素 点 。 





引 ) b) 
图 8-2 4 连通 和 8 连通 示意 图 
a4 连 通 b)8 连 通 

根据 上 述 基本 概念 ， 可 以 给 出 图 像 分 割 的 一 般 性 定义 ， 即 图 像 分 割 是 指 将 一 幅 离 散 数字 
图 像 信 号 rm, 站 进行 分 割 ， 将 分 割 为 若干 相连 的 、 非 空子 区 域 用 ,万 ,万 …, 矿 ， 且 满足 如 下 
均一 性 准则 。 

1) HUAUAU…U 记 =7。 

2) Vi ， 当 i=12,3… 必 时， 天 是 相连 的 。 

3) Y j 均 一 性 准则 都 是 满足 的 。 

4) 对 于 任意 两 个 相连 的 上 和 乒 ，ECAU 万 )= 作 。 

目前 ， 已 经 提出 的 图 像 分 割 方法 很 多 ， 综 合 各 种 方法 的 实质 ， 图 像 分 割 有 三 种 不 同 
的 途径 ， 分 别 介绍 如 下 。 

1) 以 区 域 为 对 象 进行 分 割 ， 以 相似 性 原则 作为 分 割 的 依据 ， 即 根据 图 像 的 灰 度 、 色 
彩 、 变 换 关系 或 组 织 结构 等 方面 的 特征 相似 来 划分 图 像 的 子 区 域 ， 并 将 各 像素 划 归 到 相应 物 
体 或 区 域 的 像素 聚 类 方法 ， 即 区 域 法 。 

2) 以 物体 的 边界 为 对 象 进行 分 割 ， 通 过 直接 确定 区 域 间 的 边界 来 实现 分 割 的 边界 方法 。 

3) 先 检测 边缘 像素 ， 再 将 边缘 像素 连接 起 来 构成 边界 形成 分 割 。 

这 些 方法 是 互补 的 ， 在 有 些 场合 适宜 应 用 某 一 种 分 割 方法 ， 而 另 一 些 场合 则 适宜 采用 另 
一 种 分 割 方法 ， 有 时 还 要 将 它们 有 机 地 结合 起 来 ， 以 求 得 更 好 的 分 割 效果 。 

值得 指出 的 是 ， 图 像 分 割 没 有 唯一 的 、 标 准 的 、 通 用 的 分 割 方法 ， 也 没有 一 成 不 变 、 适 
应 一 切 情况 的 最 优 分 割 准 则 ， 而 必须 根据 具体 图 像 和 不 同 应 用 目的 来 采用 合适 的 分 割 方法 。 
在 图 像 分 割 技术 中 ， 最 常用 的 是 利用 图 像 阀 值 化 处 理 进行 的 图 像 分 割 。 


国 国 艾诺 取 值 法 人 | 
常用 的 图 像 分 割 方法 是 把 图 像 灰 度 分 成 不 同 的 等 级 ， 然 后 用 设置 灰 度 门限 值 〈 阔 值 ) 的 
方法 确定 有 意义 的 区 域 或 分 割 物体 的 边界 。 常 用 的 阔 值 化 处 理 就 是 图 像 的 二 值 化 处 理 ， 即 选 











择 一 个 阔 值 ， 将 图 像 转换 为 黑白 二 值 图 像 ， 用 于 图 像 分 割 及 边缘 提取 等 处 理 之 中 。 
图 像 阔 值 化 处 理 的 变换 函数 形式 如 下 : 


0 yc) 过 了 
seo 和 (8-1) 全 
图 像 阔 值 化 处 理 是 一 种 阶梯 函数 ， 属 于 图 像 亦 度 级 的 非 线性 运算 ， 该 变换 函数 曲 训 
线 如 图 8-3 所 示 。 它 的 功能 是 由 用 户 指定 一 个 闪 值 ， 如 果 图 像 中 某 个 像素 的 灰 度 值 大 于 该 阔 
值 ， 则 将 该 像素 的 灰 度 值 置 为 255， 否 则 将 其 灰 度 值 置 为 0。 











图 8-3 ” 闪 值 变换 曲线 


采用 图 像 的 阔 值 化 分 割 过 程 中 ， 阔 值 的 选取 对 处 理 结果 的 影响 很 大 。 如 图 8-4 所 
示 ， 图 8-4a 为 原始 图 像 ， 图 像 中 的 目标 为 米粒 ， 图 8-4b 为 原始 图 像 的 灰 度 直方 图 。 
分 析 该 直方 图 可 知 ， 该 直方 图 具有 双 峰 特性 ， 图 像 中 的 目标 分 布 在 较 暗 的 灰 度 级 上 形 
成 一 个 波峰 ， 图 像 背 景 分 布 在 较 亮 的 灰 度 级 上 形成 另 一 个 波峰 。 因 此 ， 从 理论 上 讲 ， 
以 直方 图 双 峰 之 间 的 谷底 处 灰 度 值 作 为 阔 值 进行 图 像 的 阔 值 化 处 理 ， 便 可 将 目标 和 背 
景 分 割 开 来 。 


Mam| 
到 | 
可 
由 








图 8-4 ” 阔 值 分 割 法 原理 
a) 原始 图 像 b) 直方 图 
图 8-5a 选取 阔 值 7= 91;， 图 8-$b 选取 阔 值 7=140 ; 图 8-5c 选取 阔 值 Z=120; 图 8-5d 


选取 阔 值 7= 56 ， 由 于 选取 了 不 同 的 阀 值 7， 因 此 ， 图 像 的 分 割 结果 具有 明显 的 差别 。 程 序 
代码 如 下 ， 结 果 如 图 8-5 所 示 。 


clear 











imread(rice.png ); 
=im2bw(L91/255); 







14=im2bw(L,120/2: 
1S=im2bw(1,36/255 
figure,imshow(I2) 
figure,imshow(I3) 
figure'imshow(l4) 
figureimshow(15) 





图 8-5 不 同 阅 值 对 阅 值 化 结果 的 影响 


避 T=91 bj) T=140 ec)T=120 d)T=56 


由 图 8-5 可 知 ， 图 像 分 割 过 程 中 ， 若 闪 值 选取 过 大 ， 则 会 提取 图 像 的 多 余部 分 ， 








若 阔 值 过 小 ， 则 又 会 丢失 所 需 的 部 分 。 因 此 ， 阔 值 的 选取 对 图 像 的 分 割 具有 非常 重要 
的 作用 。 
当 图 像 灰 度 直方 图 的 双 峰 特性 不 明显 ， 即 图 像 中 的 目标 部 分 和 背景 之 间 亮 度 差 较 小 时 ， 


直接 用 直方 图 就 不 太 容易 确定 一 个 合适 的 阔 值 。 此 时 ， 可 用 最 小 误差 阔 值 法 、 最 大 误差 阔 值 
法 、 最 佳 阔 值 法 、 判 别 法 分 析 法 或 其 他 合理 的 方法 来 确定 阔 值 。 

1. 最 小 误差 阔 值 

假如 一 幅 图 像 ， 设 对 象 物 的 灰 度 分 布 具有 平均 值 为 w ， 标 准 差 为 5 的 正 态 分 布 概率 密 
度 函 数 p(z) ;背景 的 灰 度 分 布 具有 平均 值 为 v， 标 准 差 为 r 的 正 态 分 布 概率 函数 4(z) ， 如 
图 8-6 所 示 。 














0 四 扫 
图 8-6 ”目标 和 背景 概率 密度 分 布 


设 对 象 物 占 整体 图 像 的 比例 为 +， 此 时 整体 图 像 的 灰 度 概率 密度 为 
如 (2)+(-D9(2) (8-2) 
现在 用 阔 值 7 分 开 : 当 z< 了 时 为 背景 ， 反 之 则 是 对 象 物 。 此 时 ， 把 背景 误 认为 对 象 物 的 
概率 为 


2O= | 4G 志 (8-3) 
把 对 象 物 误 认为 背景 的 概 认为 
1-PD= 人 wei G8-4) 
那么 错误 区 分 的 概率 为 
了 -PCDJ+G-00(D) G8-5) 


求 式 〈8-5) 为 最 小 值 时 的 2 ， 便 是 阔 值 ， 也 就 是 对 式 〈8-5) 求 微分 并 使 其 为 零 。 
d 
还 如 -POCOD+U-020C)=0 


所 以 
(=-04(0)-i(OD)=0 (8-6) 

根据 假设 ， 当 六 P(z) 、4(z) 已 知 时 ， 可 求解 闪 值 7 。 利 用 这 种 方法 求 取 阔 值 7 时 ， 必 须 用 
两 个 已 知 正太 分布 的 曲线 合成 来 近似 直方 图 的 分 布 ， 还 要 给 定 两 个 正 态 分 布 合成 的 比例 
所 以 实现 起 来 比较 复杂 ， 必 须 用 数值 计算 才能 得 到 。 

2. 最 大 方差 阔 值 

最 大 方差 闵 值 也 叫 大 津 闪 值 ， 是 1980 年 由 日 本 的 大 津 展 之 提出 的 ， 它 是 在 差别 与 最 小 
二 乘法 原理 的 基础 上 推导 出 来 的 ， 可 得 到 较 好 的 结果 。 

把 直方 图 在 某 一 阔 值 处 分 割 成 两 组 ， 当 被 分 成 的 两 组 间 方 差 为 最 大 时 ， 决 定 阔 值 。 现 
在 ， 设 一 幅 图 像 的 灰 度 值 为 1 一 疡 级 ， 灰 度 值 ; 的 像素 数 为 让， 此 时 得 到 : 

像素 总 数 为 


《8-7) 





各 灰 度 值 的 概率 为 
和 二 二 (8-8) 
然后 用 了 将 其 分 成 两 组 Cu = 人 一 7 和 Ci= 亿 +1 一 巴 ， 各 组 产生 的 概率 如 下 : 
Co 产生 的 概率 为 Wo = =w(7) (8-9) 


让 








Ci 产生 的 概率 为 出 = 户 =1-mm (8-10) 








Cu 的 平均 值 为 一 作 人 (C8-11) 
本 
CI 的 平均 值 为 站 = SA (8-12) 


泉 w 1-wD 
了 
式 中 ，w= 》 让 是 整体 图 像 的 灰 度 平均 值 ，w(T) = 》 7 是 阔 值 为 了 时 的 灰 度 平均 值 ， 所 


四 
以 全 部 采样 的 灰 度 平均 值 为 
让 二 网 人 十 二 向 (8-13) 





两 组 间 的 方差 可 用 下 式 求 出 : 
(= 一 AL + 同 (WA = 一) 


_[LAnwC)-AC 
ww(TD] 
从 1 一 mm 改变 T， 求 式 〈8-14) 为 最 大 值 时 的 T， 即 求 max 562(7) 时 的 7 值 ， 此 时 ，T” 
便 是 阔 值 。62(7) 叫做 阔 值 选择 函数 。 
不 管 图 像 的 直方 图 有 无 明显 的 双 峰 ， 此 方法 都 能 得 到 较 满 意 的 结果 ， 因 此 ， 这 种 方法 是 
值 自动 选择 的 最 优 方法 。 图 8-7 给 出 了 最 大 方差 冰 值 分 割 的 实例 。 


3. 最 佳 阔 值 法 
设 图 像 由 物体 和 背景 两 部 分 组 成 ， 物 体 像素 的 灰 度 级 具有 正 态 概率 密度 函数 P(z)， 其 


均值 为 人 ， 方 差 为 53 。 背 景 像素 的 灰 度 级 也 具有 正 态 概率 密度 函数 9(2)， 其 均值 为 "， 方 


差 为 rz 。 物 体 占 总 图 像 面 积 的 比例 为 4 ， 背 景 所 占 面积 为 1- 4 ， 因 此 ， 该 图 像 总 的 灰 度 概 
率 密度 函数 为 


(08-14) 





可 划 
图 8-7 最 大 方差 闭 值 分 割 实例 
司 原始 图 像 b) 最 大 方 益 闭 值 选择 e) 值 分 割 结果 


4P(z)+( 一 4)9(2) (8-15) 
令 图 像 值 为 gp 并 且 将 小 于 t 的 全 部 点 称 为 目标 物体 点 ， 而 将 不 小 于 的 全 部 点 称 为 背 
那么 ， 设 将 背景 点 错 归 为 目标 物体 点 的 概率 为 @(D) ， 将 目标 物体 点 错 归 为 背景 点 的 
CD， 因而 有 









QO= 9)dz (8-16) 


马 )= | ad =1-Po (8-17) 
总 的 错 分 概率 为 
42(D)+d-2000= 和 0-POI+G-DOO 08-18) 
显然 ， 使 上 式 最 小 的 阔 值 t 为 最 佳 益 值 。 因 此 ， 对 式 〈8-18) 微分 可 得 
(=-4)g(0D)=4p(D (8-19) 


由 于 P(D) 和 4(0) 都 服从 正 态 分 布 ， 因 而 有 








将 式 (8-20)、(8-21) 代入 式 〈8-19) 并 取 自 然 对 数 可 得 
瑟 oHHO 及 -全 扩 -1C 人 
27 20 


矶 


T2(-A2 -ad-D) =2c2r2ln 和 





根据 上 式 ， 若 4=0.5,r=a， 则 可 以 得 出 ; 


ie (8-22) 

4. 差别 分 析 法 

差别 分 析 法 确定 最 佳 阔 值 的 原则 是 进行 阔 值 处 理 后 ， 被 分 离 的 像素 类 之 间 的 类 间 方 差 最 
大 。 差 别 分 析 法 需要 计算 直方 图 的 0 阶 矩 和 !1 阶 矩 ， 它 是 图 像 阀 值 化 处 理 中 常用 的 自动 确定 
阔 值 的 方法 。 

设 图 像 总 像素 数 为 Y， 灰 度 值 为 大 的 像素 数 以 尺 表 示 ， 则 灰 度 级 为 开 的 灰 度 分 布 的 0 阶 
和 托 及 1 阶 矩 分 别 定义 如 下 。 


0 阶 矩 为 
上 
at) = > 立 (8-23) 
气 
1 阶 矩 为 
过 
ao(= (8-24) 


邱 
当 上 =Z 工 -1 时 ，w(L-D=1;， ACE-D=/， 其 中 ，AH4 为 图 像 的 平均 灰 度 值 。 
设 图 像 的 M -1 个 阅 值 为 : 0 乏 厂 < 后 < 后 <…< 有 和 荆 -1， 将 图 像 分 割 成 M 个 灰 度 
值 的 类 Cj ， 且 
Ci e[E + 司 =0,tr = 志 7=123…,M 
则 各 类 C， 发 生 的 概率 为 
Wi =O6) 一 OU 











而 相应 的 概率 平均 值 为 


AD)-Ak-D) (8-25) 
” ok)-ok-D) 
其 中 ，w(0)=0,w(O)=0。 
因此 ， 可 得 各 类 的 类 间 方 差 为 
(row 一 (8-26) 

式 中 ，w 为 相应 的 概率 值 。 

将 使 式 8-26) 的 ez 值 为 最 大 的 阔 值 组 (6 所 , 司 ,or) ， 作 为 M 值 化 的 最 佳 阔 值 
组 。 若 分 割 成 两 类 ， 即 取 M 为 2， 则 可 求 出 二 值 化 的 阔 值 。 

对 于 复杂 图 像 ， 在 许多 情况 下 对 整 幅 图 像 用 单一 阔 值 不 能 给 出 理想 的 分 割 结果 。 例 
如 ， 若 为 光亮 背景 上 的 暗 物 体 图 像 ， 由 于 照射 光 的 不 均匀 ， 虽 然 物 体 与 背景 始终 有 反差 ， 
但 在 图 像 的 某 一 部 分 物体 和 背景 都 比 另 一 部 分 亮 。 因 此 ， 在 图 像 的 一 部 分 能 把 物体 和 背景 
精确 地 分 开 的 闪 值 ， 对 另 一 部 分 而 言 ， 可 能 会 把 太 多 的 背景 也 作为 物体 进行 分 割 。 克 服 这 
一 缺点 有 如 下 一 些 方法 : 如 果 已 知 图 像 上 的 位 置 函 数 用 来 描述 不 均匀 照射 ， 则 可 以 先 设法 
应 用 灰 度 级 校正 方法 进行 校正 ， 然 后 采用 单一 阔 值 进行 分 割 ， 另 一 种 方法 是 将 图 像 分 成 子 
区 域 ， 对 每 一 子 区 域 设置 局 部 阀 值 。 但 是 ， 如 果 某 一 子 区 域 仅仅 含有 物体 或 仅 有 背景 ， 那 
么 该 子 区 域 就 找 不 到 阔 值 。 这 时 ， 可 以 根据 邻近 子 区 域 的 局 部 闪 值 通过 内 插值 法 求 得 该 子 
区 域 的 一 个 阔 值 。 

在 确定 阔 值 时 ， 如 果 阔 值 过 高 ， 则 偶然 出 现 的 物体 像素 点 就 会 被 认为 是 背景 点 ; 如 果 阔 
值 过 低 ， 则 会 发 生 相 反 的 情况 。 克 服 这 种 情况 的 方法 是 使 用 两 个 阔 值 。 例 如 ，6 < 书 ， 将 灰 
度 值 超过 妃 的 像素 分 类 为 核心 物体 点 ， 而 灰 度 值 超过 的 像素 ， 仅 当 它 们 紧 靠 核心 物体 点 时 
才 认为 是 物体 点 。 记 的 选择 要 使 每 个 物体 有 一 些 像素 灰 度 级 高 于 记 ， 而 背景 不 含有 这 样 的 像 
素 。 同 时 ， 应 选择 1 使 每 个 物体 像素 点 高 于 灰 度 级 。 如 果 只 使 用 请， 则 物体 总 是 分 割 得 不 
完整 ， 如果 只 使 用 6 ， 则 会 有 许多 背景 像素 被 错 分 为 物体 像素 。 但 是 ， 如 果 同 时 使 用 6 和 总 
两 个 值 ， 就 能 把 背景 与 物体 很 好 地 分 割 开 来 。 当 然 ， 如 果 物 体 与 背景 的 对 比 是 鲜明 的 ， 就 不 
必 使 用 这 种 方法 。 

此 外 ， 如 果 存 在 一 个 阅 值 e， 使 得 每 个 物体 的 像素 灰 度 级 高 于 总 ， 而 背景 不 包含 这 种 像 
素 ， 则 可 对 图 像 设 置 阔 值 2， 然 后 检查 高 于 闪 值 像素 的 区 域 ， 目 的 是 寻找 一 个 局 部 阔 值 ， 以 
便 在 每 个 类 似 区 域 中 把 物体 和 背景 分 开 。 如 果 这 些 物体 相当 小 ， 并 且 不 太 靠 近 ， 那 么 这 种 方 
法 比较 适用 。 所 使 用 的 区 域 应 足够 大 ， 以 保证 它们 既 包 含 物体 像素 ， 也 包含 背景 像素 ， 这 样 
就 可 以 使 区 域 的 直方 图 是 双 峰 的 。 

有 时 需要 寻找 一 幅 图 像 的 局 部 最 大 点 ， 即 提取 比 附 近 像素 具有 较 高 的 某 种 局 部 性 质 值 的 
像素 。 一 般 来 讲 ， 也 要 求 这 些 点 具有 高 于 一 个 低 阔 值 二 的 值 ， 一 旦 超过 A， 不 管 它 的 绝对 值 
大 小 如 何 ， 一 切 相 对 的 最 大 值 都 被 采纳 。 因 此 ， 可 把 寻找 局 部 最 大 值 看 为 局 部 设置 阔 值 的 极 
端 情况 。 在 对 图 像 进 行 匹配 运算 或 检测 界线 时 可 采用 这 种 方法 。 


8.2 ”边缘 检测 


数字 图 像 的 边缘 检测 是 图 像 分 割 、 目 标 区 域 识别 、 区 域 形 状 提 取 等 图 像 分 析 领 域 十 分 于 




















性 








要 的 基础 ， 也 是 图 像 识别 中 提取 图 像 特 征 的 一 个 重要 属性 。 在 进行 图 像 理解 和 分 析 时 ， 第 一 
步 往往 就 是 边缘 检测 ， 目 前 它 已 成 为 机 器 视觉 研究 领域 最 活跃 的 课题 之 一 ， 在 工程 应 用 中 占 
有 十 分 重要 的 地 位 。 

物体 边缘 是 以 图 像 的 局 部 特征 不 连续 的 形式 出 现 的 ， 即 是 指 图 像 局 部 亮度 变化 最 显著 的 
部 分 ， 如 灰 度 值 的 突变 、 颜 色 的 突变 、 纹 理 结构 的 突变 等 ， 同 时 物体 的 边缘 也 是 不 同 区域 的 
分 界 处 。 图 像 边 缘 具 有 方向 和 幅度 两 个 特性 ， 通 常 沿边 缘 的 走向 灰 度 变化 平缓 ， 垂 直 于 边缘 
走向 的 像素 灰 度 变换 剧烈 。 根 据 灰 度 变化 的 特点 ， 可 分 为 阶 跃 型 、 房 项 型 和 凸 缘 型 ， 如 图 8-8 


阶 跃 型 屋顶 型 凸 缘 型 
图 8-8 图 像 边 缘 的 灰 度 变化 


利用 边缘 检测 来 分 割 图 像 ， 其 基本 思想 就 是 先 检测 图 像 中 的 边缘 点 ， 再 按照 某 种 策略 将 
边沿 点 连接 成 轮廓 ， 从 而 构成 分 割 区 域 。 由 于 边缘 是 所 要 提取 目标 和 背景 的 分 界线 ， 提 取出 
边缘 才能 将 目标 和 背景 分 开 ， 因 此 边缘 检测 技术 对 于 数字 图 像 十 分 重要 。 

图 像 中 某 物体 边界 上 的 像素 点 ， 其 领域 将 是 一 个 灰 度 级 变化 带 。 衡 量 这 种 变化 最 有 效 的 
两 个 特征 值 就 是 灰 度 的 变化 率 和 变化 方向 ， 它 们 分 别 以 梯度 向 量 的 幅 值 和 方向 来 表示 。 对 于 
连续 图 像 (xy) ， 其 方向 导数 在 边缘 〈 法 线 ) 方向 上 有 局 部 最 大 值 。 因 此 ， 边 缘 检 测 就 是 
求 /xy) 梯度 的 局 部 最 大 值 和 方向 。 

已 知 F(xy) 在 2 方向 沿 ~ 的 梯度 定义 如 下 : 

双 - 久 io 术 由 


人 0 〈8-27) 


世 达到 最 大 值 的 条 件 是 一 2 1 -0， 即 
-Asing,+ 矿 cos =0 
得 &. = arctan 帮 / 太 ,或 .+ (8-28) 
梯度 最 大 值 g= 位 代 = 大 + 7 ， 一 般 称 为 梯度 模 。 梯 度 模 低 子 具 有 位 移 不 变性 和 
各 向 同性 的 性 质 ， 适 用 于 边缘 检测 ， 而 灰 度 变化 的 方向 ， 即 边界 的 方向 则 可 直 
& =arctang 太 /大 得 到 。 


在 实际 应 用 中 ， 为 了 简便 ， 一 般 将 算 子 以 微分 算 子 的 形式 表示 ， 然 后 采用 快速 卷 积 函 数 
来 实现 ， 这 种 实现 方法 可 以 得 到 快速 而 有 效 的 处 理 。 


臣 








常用 的 微分 算 子 有 Roberts 算 子 、Prewitt 算 子 、Sobel 算 子 以 及 Isotropic Sobel 算 子 ， 这 
里 主要 介绍 前 三 个 算 子 。 
1. Roberts 算 子 
对 于 离散 图 像 来 说 ， 边 缘 检 测算 子 就 是 用 图 像 的 垂直 和 水 平 差分 来 和 逼 近 梯 度 算 子 : 
VV=UonD-7cz-b)-7ocy-D) 08-29) 
因此 ， 当 需要 检测 图 像 边缘 时 ， 最 简单 的 方法 就 是 对 每 个 像素 计算 YF ， 然 后 求 绝对 
值 ， 最 后 进行 阔 值 操作 就 可 以 实现 。Roberts 算 子 就 是 基于 这 种 思想 ， 该 算 子 见 式 〈8-30)。 
RGCD=VOUGD-AG+L7+DP+CUGJ+D-AG+L 《8-30) 
它 可 以 由 以 下 两 个 2x 2 的 模板 共同 实现 : 


和 0 1 
| 四 

2.，Prewitt 算 子 和 Sobel 算 子 

在 比较 复杂 的 图 像 中 ， 仅 用 2x2 的 Roberts 算 子 得 不 到 较 好 的 边缘 检测 ， 而 相对 较 复 杂 
的 3x3 的 Prewitt 算 子 和 Sobel 算 子 检测 效果 较 好 。 

和 Roberts 算 子 类 似 ，Prewitt 算 子 也 可 以 通过 以 下 两 个 模板 实现 : 
-1 -1 -1! 二 
标 江 其 ”: 丰 -101 
-1 0 1 

以 上 两 矩阵 分 别 代表 图 像 的 水 平 梯度 和 垂直 梯度 。 如 果 用 Prewitt 算 子 检 测 图 像 M 的 边 
缘 ， 一 般 先 用 水 平 算 子 和 垂直 算 子 对 图 像 进 行 卷 积 ， 得 到 两 个 矩阵 MI 、M2 ， 在 不 考虑 边 
界 因素 的 时 候 ， 它 们 与 原 图 像 有 相同 的 大 小 ， 分 别 表 示 图 像 M 中 相同 位 置 对 Pr 和 Pr 的 偏 
导数 。 然 后 求 M1 和 M2 对 应 位 置 的 两 个 数 的 平方 和 ， 得 到 一 个 新 的 矩阵 C。C 是 M 中 像素 
灰 度 梯度 的 近似 值 ， 然 后 经 过 阔 值 操作 得 到 边缘 ， 即 

G=(M@ 有 +COM@ 启 靖 >Tjres 斌 
Sobel 算 子 与 Prewitt 算 子 的 区 别 仅 在 于 选用 的 模板 不 同 : 


2 -1 0 1 
和 人 让 -2 02 
| = 不 


不 同 的 算 子 选取 不 同 的 模板 ， 为 什么 要 这 么 选取 呢 ? 这 是 由 以 下 原理 决定 的 。 
假定 图 像 M 的 灰 度 满 足以 下 关系 式 ; 

Me =cxz+DDY+7 
即 梯度 为 (wx,8) ， 则 每 一 像素 的 8 领域 像素 值 为 
































-CC=-D+7 -CC+y -cf+p+7 
| -B+Y 儿 PT+7 
a-Pp+ ax+y a+p+y 全 
则 定义 水 平 算 子 和 垂直 算 子 为 攻 
5810 冯 “和 
= 十 本 人 
7 油 让 











将 这 两 个 模板 同 原始 图 像 像素 进行 卷 积 ， 可 得 到 的 方向 导数 为 

8 =2p(Ca+ 首 

8&, =2a(2a+ 甩 
所 以 得 到 像素 的 梯度 大 小 为 

8g -人 _ = ge: +8; =2(2a+DVo2 + (8-31) 
显然 ， 如 果 要 使 得 梯度 为 常量 ， 则 应 该 使 得 22a+ 刀 =1。 
如 果 a=2=1/6， 则 得 到 1/6 乘 Prewitt 算 子 : 取 a= 1/8，0= 1/4， 则 得 到 1/8 乘 Sobel 
算 子 。 
为 了 方便 ， 下 面 对 上 述 常 用 算 子 的 模板 进行 总 结 ， 见 表 8-1。 
表 8-1 ”常用 边缘 检测 算 子 模板 





























算 子 名 称 加 加 和 
关 河 1 边缘 定位 准 
Roberis 加 | 到 | 对 噪声 有 抑制 作用 
| 请 本 三 | 
平均 、 微 分 
Prewit < 0 对 噪声 有 抑制 作用 
-1 0 1 和 
-101 本 天 
加 树 平均 
Sobel 有 0 0 0 边 宽 >2 像素 
二 | 
二 人 
树 值 反比 于 人 点 与 中 心 点 的 距离 
Tsotropic Sobel 0 0 0 0 | | 检测 沿 不 同 边缘 方向 时 焕 度 幅度 一 到 
人 本 友 1 











MATLAB 7. 0 图 像 处 理工 具 箱 中 提供 了 专门 的 边缘 检测 edgeO 函 数 ， 其 调用 格式 如 下 : 
@ BW=edge(L method) 

@ BW=edge(L method', thresh) 

@@ BW=edge(L method', thresh, direction) 

@@ [BW,threshj=edge( method…) 

其 中 ，I 是 输入 图 像 ，method 是 选用 的 方法 〈 算 子 )， 可 以 选择 的 method 有 Sobel、 


Prewitt、Roberts、log、Candy、zerocross 等 。 


可 选 的 地 


下 面 ， 









进行 边缘 提取 ， 程 序 代码 如 下 : 


I=imread(tire.tif); 
figure,imshow(D); 
BW1=edge(l,sobel.0.1); 
figure,imshow(BWD) 
BW2=edge(Ivroberts.0.1) 
figurejimshow(BW2) 
BW3=edge(Ivprewitt.0.1) 


figureiimshow(BW3) 


执行 以 上 程序 ， 效 果 如 图 8-9b 一 4 所 示 





人 拉 普 拉 斯 高 斯 算 子 LOG 


前 面 都 是 利用 





有 thresh〈 门 限 )、sigma (方差 )》 和 direction ( 方 
用 edgeO 函 数 ， 分 别 采 用 3 种 不 同 的 边缘 检 沉 





] 8-9a 所 示 的 原始 


图 8-9 不 同 的 边缘 检测 算 子 进行 提取 的 








b) Sobel 算 子 检测 效果 


cj Roberts 算 了 





d) Prewitt 算 子 检测 效果 


妆 3 个 算 子 的 检测 效果 ， 可 以 发 现 Sobel 算 子 和 Prewitt 算 子 的 效果 比较 好 












了 灰 度 图 像 的 拐点 位 置 是 边缘 的 性 质 。 除 了 这 
阶 导 数 为 0， 如 图 8-10 所 示 


条 处 的 梯度 最 大 《〈 正 的 或 者 负 的 ) 这 一 性 质 来 进行 边缘 检测 的 ， 即 利用 


边缘 还 有 另外 一 个 性 质 ， 即 在 拐点 位 置 


























图 8-10 边缘 、 局 部 极 值 、 零 交叉 点 





图 中 由 上 到 下 分 别 是 图 像 的 拐点 〈 图 像 亦 度 值 )、 拐 点 处 的 梯度 〈 灰 度 一 阶 导数 ) 和 灰 
度 二 阶 导数 。 对 准 图 像 网 格 点 ， 可 以 发 现 二 阶 导数 为 零 交 叉 点 处 对 应 的 是 图 像 的 拐点 。 
所 以 ， 也 可 以 通过 寻找 二 阶 导数 的 零 交 叉 点 来 寻找 边缘 ， 而 Laplacian 算 子 是 最 常用 的 


二 阶 导数 算 子 。 
二 元 函数 ,F(x,y) 的 Laplacian 变换 定义 为 
7 全 :人 (8-32) 
实际 上 就 是 二 阶 偏 导数 的 和 。 将 上 式 以 差分 方式 表示 ， 得 到 式 〈8-33): 
V21=[L/ee+lD)+JGc-DD+Fooy+D+ocy-D-470c7] (8-33) 


以 模板 形式 表示 ， 就 得 到 了 常用 的 算 子 : 


V2 太 = 





本 Je 二 
1 = 汪 ) 并 
生生 


Vz2y 算 子 能 突出 反映 图 像 中 的 角 线 和 孤立 点 ， 如 对 图 8-11a 所 示 的 原始 数据 图 像 进行 
Laplacian 算 子 运算 ， 可 以 得 到 如 图 8-1lb 所 示 的 结果 ， 在 边缘 和 孤立 点 的 幅 值 都 比较 大 。 


1 
2 
1 


, 全 生 
bb- 一 
证 
ID P 一 

二 了 ES 


避 bb 
图 8-11 原始 数据 图 像 及 运算 结果 
a) 原始 数据 图 像 b) 用 Laplacian 算 子 运算 以 后 的 结果 


但 是 ， 需 要 注意 的 是 ， 由 上 述 算 子 可 以 知道 ， 一 阶 导数 对 噪声 敏感 ， 因 而 不 稳定 ， 由 


-222 




















此 ， 二 阶 导 数 对 噪声 就 会 更 加 敏感 ， 而 更 不 稳定 。 所 以 ， 在 进行 Laplacian 变换 之 前 需要 
。 同 时 ， 又 因为 卷 积 是 可 变换 、 可 结合 的 ， 所 以 先 作 高 斯 卷 积 ， 再 用 Laplacian 算 子 
作 卷 积 ， 等 价 于 对 原始 图 像 用 高 斯 函数 的 Laplacian 变换 后 的 滤波 器 作 卷 积 。 这 样 就 得 到 一 
个 新 的 滤波 器 一 -LOG (Laplacian Of Gaussian) 滤波 器 。 











JCo)=V2(GCoJJ*MOCcD) (8-34) 
式 中 ，M(x, 妇 是 图 像 。 
二 < 机 本 过 3 
CCx,y)= 7 co 2 ] (8-35) 
LoGto)=VtGte 乃 =2G+2G 


Er 人 





汪 闻 
| 2 二 
趟 | -je|- 


利用 以 下 程序 代码 段 ， 可 以 得 到 LOG 估 了 的 国人 如 图 8-12 站 


后 | (8-36) 





图 8-12 LOG 算 子 图 像 





sigma=0.6; 
y-y; 
fori=1:(410 0 全 





=1/(2*pirsigmaA4)*((xx.^2+yy.^2J/(sigma^2)-2).*exp(-(xx.^2+yy.^2)/sigma'2)); 
colormap(jet(16)); 
meshxx,yy:D 


由 图 8-12 可 以 看 出 ， 它 是 一 个 带 通 滤波 器 ， 研 究 表示 ，LOG 算 子 比 较 符合 人 的 视觉 特性 。 
在 实际 应 用 中 ， 使 用 LOG 模板 作 卷 积 ， 然 后 寻找 那些 零 交 叉 像 素 : 如 果 一 个 像素 值 小 于 











-6 ， 而 周围 邻接 的 8 个 像素 都 大 于 6 ， 则 这 个 像素 就 是 
零 交 叉 点 。 利 用 以 下 程序 代码 ， 对 图 8-9a 所 示 的 原始 图 像 
进行 LOG 算 子 边 缘 提 取 ， 得 到 如 图 8-13 所 示 的 效果 。 
BW=edge(L,log',0.01) 
figureiimshow(BW) 


Canny 算 子 





还 有 





-个 很 重要 的 边缘 检测 算 子 ， 即 Canny 算 子 ， 它 ”图 8-13 LOG 算 了 边缘 提取 的 结果 


是 最 优 的 阶梯 型 边缘 〈Step Edge) 检测 算 子 。 从 以 下 3 个 





标准 意 


2) 定位 


3) 单 响 启 


义 来 说 ，Canny 边缘 
1) 检测 标准 ， 









测算 子 对 受到 白 噪声 影响 的 阶 跃 型 边缘 是 最 优 的 。 


将 多 个 响应 降低 为 单个 边缘 响应 。 





Canny 算 阮 步 又 如 下 : 
1) 首先 用 2D 高 斯 滤波 模板 与 原始 图 像 进行 卷 积 ， 以 消除 品 
2) 利用 导数 算 子 〔 如 Prewitt 算 子 、Sobel 算 子 ) 找到 图 像 灰 度 沿 着 两 个 广 向 的 导数 


GG, ， 并 
3) 利 月 


4) 求 出 
1 





出 梯度 的 大 小 : |c|= VGz+G2 。 
C 
2) 的 结果 计算 出 梯度 的 方向 : eanan| 全 |， 


4 了 边缘 的 方向 ， 就 可 以 把 边缘 的 梯度 方向 大 致 分 为 4 种 (0”、45”、90” 和 
可 以 找到 这 个 像素 梯度 方向 的 邻接 像素 。 


5) 遍历 图 像 。 若 某 个 像素 的 灰 度 值 与 其 梯度 方向 上 前 后 两 个 像素 的 灰 度 值 相 比 不 是 最 


大 的 ， 那 么 
6) 使 


将 这 个 像素 值 置 为 0， 即 不 是 边缘 。 
累计 直方 图 计算 两 个 阔 值 。 凡 是 大 于 高 阔 值 的 一 定 





是 边缘 ;凡是 小 于 低 闪 值 的 





定 不 是 边缘 。 如 果 检测 结果 在 两 个 阔 值 之 间 ， 则 根据 这 个 像素 的 邻接 像素 中 有 没有 超过 高 


阅 值 的 边缘 





像素 ， 如 果 有 ， 则 它 就 是 边缘 ， 否 则 不 是 。 


以 下 程序 段 是 利用 MATLAB 中 的 edge0 函 数 ， 并 采用 Canny 算 子 ， 对 如 图 8-14a 所 示 
的 原始 图 像 进行 边缘 检测 ， 检 测 效 果 如 图 8-14b 所 示 。 





图 8-14 ”Canny 算 子 运算 
a) 原始 图 像 bj Canny 算 子 边缘 检测 效果 





Timread(tire tify; 
figureimshow(D); 
BW=edge(L'canny',0.1) 
figureimshow(BW) 


比较 图 8-14b 与 前 面 几 个 算 子 进行 边缘 检测 的 结果 ， 可 以 看 出 Canny 算 子 检测 结果 不 单 
能 清晰 地 提取 tire 的 边缘 ， 而 且 边 缘 连 续 比较 好 ， 这 就 是 Canny 算 子 的 优良 之 处 。 
当 有 许多 其 他 边缘 检测 算法 ， 如 与 Canny 算 子 类 似 ， 还 有 利用 边缘 方向 性 的 检测 





村 
算 子 。 其 算 述 如 下 : 

1) 设置 4 个 3x3 模板 如 图 8-15 所 示 。 显 而 易 见 ，4 个 模板 分 别针 对 0”、45”、90*” 和 
135”4 个 方向 的 梯度 设置 ， 并 以 (x, 世 点 为 中 心 将 3x3 的 区 域 分 成 两 个 部 分 ， 按 照 这 4 个 模 
板 分 别 对 图 像 中 的 每 一 像素 点 进行 卷 积 求 和 操作 。 

2) 对 图 像 中 每 一 像素 点 求 出 的 4 个 卷 积 和 求 绝对 值 ， 并 将 每 个 结果 分 别 与 一 个 阔 值 比 
较 ， 如 果 其 中 任意 一 个 结果 大 于 或 等 于 阔 值 7 ， 则 该 模板 的 中 心 点 所 对 应 的 像素 点 的 灰 度 值 
为 225， 否 则 为 0。 

















国 6 林 可 本 E 

大 区 本 全 | EGG 商 
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加 45” 
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国葬 区 号 旺 马 

局: 末 因 加 区 司 
90 135" 


图 8-15 边缘 检测 算 子 模板 


8.3 区域 分 割 


阔 值 分 割 法 由 于 没有 或 很 少 考虑 空间 关系 ， 使 多 阔 值 选择 受到 限制 ， 基 于 区 域 的 分 割 方 
法 可 以 弥补 这 点 不 足 。 该 方法 利用 的 是 图 像 的 空间 性 质 ， 认 为 分 割 出 来 的 属于 同一 区 域 的 像 
素 应 具有 相似 的 性 质 ， 其 概念 是 相当 直观 的 。 传 统 的 区 域 分 割 法 有 区 域 生 长 法 和 分 裂 合并 
法 ， 下 面 对 这 两 种 方法 加 以 介绍 。 


1 区 域 生长 的 原理 和 步骤 

区 域 生长 的 基本 思想 是 将 具有 相似 性 质 的 像素 集合 起 来 构成 区 域 。 具 体 是 先 对 每 个 需要 
分 割 的 区 域 找 一 个 种 子 像素 作为 生长 的 起 点 ， 然 后 将 种 子 像素 周围 领域 中 与 种 子 像素 有 相同 
或 相似 性 质 的 像素 〈 根 据 某 种 事先 确定 的 生长 或 相似 准则 来 判定 ) 合并 到 种 子 像素 所 在 的 区 
域 中 。 将 这 些 新 像素 当做 新 的 种 子 像素 继续 进行 上 面 的 过 程 ， 直 到 笨 没 有 满足 条 件 的 像素 可 
被 包括 进来 ， 这 样 ， 一 个 区 域 就 长 成 了 。 





图 8-16 给 出 了 已 知 种 子 点 进行 区 域 生 长 的 一 个 示例 。 图 8-16a 人 
已 知 有 两 个 种 子 像素 〈 标 为 深浅 不 同 的 灰色 方块 )， 现 要 进行 区 域 生长 。 假 设 ; 
断 准 则 是 : 如 果 所 考虑 的 像素 与 种 子 像素 灰 度 值 差 的 绝对 值 小 于 则 将 
括 进 种 子 像素 所 在 的 区 域 。 图 8-16b 给 出 六 3 时 的 区 域 生 长 结果 ， 整 幅 图 像 被 较 好 地 分 成 两 量 





个 区 域 ， 图 8-16c 给 出 了 =1 时 的 区 域 生 长 结果 ， 有 些 像 素 图 8-16d 给 出 7T=6 时 
的 区 域 生长 结果 ， 整 幅 图 像 都 被 分 在 一 个 区 域 中 了 ， 由 些 可 见 阔 值 的 选择 是 很 重要 的 。 











| 了 | 长 计 这 1 7 5 
7 1 7 7 
o15 芒 :||1i1 1 
2 5 6 5 | 汪汪 2 
225 6 4 1 1 2 
a) b) 吕 





图 8-16 ”区域 生 长 示例 







才 需 要 解决 3 个 问题 : 


2) 确定 在 生 下 本 村 各 从 训 包 失 

3) 制定 生长 过 程 停止 的 条 件 或 规则 。 

种 子 像素 的 选取 借助 具体 问题 的 特点 进行 。 例如 用 红外 图 像 中 检测 目标 时 ， 
由 于 一 般 情况 下 目标 辐射 较 大 ， 所 以 可 以 选用 图 中 最 亮 的 像素 作为 种 子 人 如 果 对 具体 
问题 没有 先 验 知识 ， 则 可 借助 生长 所 用 准则 对 像素 进行 相应 计算 。 如 果 计 算 结 果 呈 现 聚 类 
的 情况 ， 则 接近 聚 类 中 心 的 像素 可 取 为 种 子 像素 。 以 图 8-17 为 例 ， 通 过 对 它 做 直方 图 可 
知 ， 具 有 灰 度 值 为 1 和 5 的 像素 最 多 且 处 在 聚 类 的 中 心 ， 所 以 可 各 选 一 个 具 类 中 心 灰 
度 值 的 像素 作为 种 子 。 在 选择 种 子 像素 时 可 以 由 某 种 规则 自动 选取 ， 也 可 以 用 交互 的 方式 
完成 。 





















图 8-17 区 域 生长 的 实例 
a 原始 图 像 b) 区 域 生长 结果 


生长 准则 的 选取 不 仅 依赖 于 问题 本 身 ， 也 和 所 用 图 像 数 据 的 种 类 有 关 。 例 如 ， 当 图 像 是 
彩色 的 时 候 ， 仅 用 音色 的 准则 效果 就 会 受到 影响 。 另 外 还 要 考虑 像素 间 的 连通 性 和 邻近 性 ， 否 











则 ， 有 时 会 出 现 无 意义 的 结果 。 我 们 将 在 后 面 介 绍 几 种 典型 的 生长 准则 和 对 应 的 生长 过 程 。 
一 般 生长 过 程 在 进行 到 再 也 没有 满足 生长 准则 的 像素 时 停止 ， 但 常用 的 基于 灰 度 、 纹 理 
和 彩色 的 准则 大 都 基于 图 像 的 局 部 性 质 ,并 没有 充分 考虑 生长 的 “历史 ”。 为 增加 区 域 生 长 





的 性 能 ， 常 需 考虑 一 


2. 生长 准则 








与 尺寸 、 形 状 等 图 像 和 目标 的 全 局 性 质 有 关 的 准则 。 在 这 种 情况 下 ， 
常 需 对 分 割 结果 建立 一 定 的 模型 或 辅 以 一 定 的 先 验 知识 。 


区 域 生长 的 一 个 关键 是 选择 合适 的 生长 准则 ， 大 部 分 区 域 生长 准则 使 用 图 像 的 局 部 性 
质 。 生 长 准则 可 根据 不 同 原则 制定 ， 而 使 用 不 同 的 生长 准则 会 影响 区 域 生长 的 过 程 ， 下 面 介 


绍 3 种 基本 的 生长 准则 和 方法 。 
《1) 基于 区 域 灰 度 差 


基于 区 域 灰 度 差 的 方法 主要 有 以 下 步骤 。 
1) 对 像素 进行 扫描 ， 找 出 尚 没有 归属 的 像素 。 





2) 以 该 像素 为 中 心 检查 它 的 领域 像素 ， 即 将 领域 中 的 像素 逐个 与 它 比 较 ， 如 果 灰 度 差 


小 于 预先 确定 的 阔 值 ， 将 它们 合并 


器 


扩张 。 


3) 以 新 合并 的 像素 为 中 心 ， 返 回 到 步骤 2)， 检 查 新 像素 的 领域 ， 直 到 区 域 不 能 进一步 


4) 返回 到 步骤 1)， 继 续 扫描 ， 直 到 所 有 像素 都 归属 ， 则 结束 整个 生长 过 程 。 

采用 上 述 方法 得 到 的 结果 对 区 域 生长 起 点 的 选择 有 较 大 的 依赖 性 。 为 克服 这 个 问题 可 以 
对 方法 进行 以 下 改进 : 将 灰 度 差 的 阔 值 设 为 零 ， 这 样 具 有 相同 灰 度 值 的 像素 便 合 并 到 一 起 ， 
然后 比较 所 有 相 邻 区 域 之 间 的 平均 灰 度 差 ， 合 并 灰 度 差 小 于 某 一 阔 值 的 区 域 。 这 种 改进 仍然 
存在 一 个 问题 ， 即 当 图 像 中 存在 缓慢 变化 的 区 域 时 ， 有 可 能 会 将 不 同 区 域 逐 步 合 并 而 产生 错 
误 的 分 割 结果 。 一 个 比较 好 的 做 法 是 : 在 进行 生长 时 ， 不 用 新 像素 的 灰 度 值 与 领域 像素 的 灰 
度 值 比较 ， 而 是 用 新 像素 所 在 区 域 的 平均 灰 度 值 与 各 领域 像素 的 灰 度 值 进行 比较 ， 将 小 于 某 





一 阔 值 的 像素 合并 进来 。 
(2) 基于 区 域内 灰 度 分 布 统计 性 质 


这 里 考虑 以 灰 度 分 布 相似 性 作为 生长 准则 来 决定 区 域 的 合并 ， 具 体 步骤 为 


1) 把 像素 分 成 互 不 重合 的 小 区 域 。 





2) 比较 邻接 区 域 的 累积 灰 度 直方 图 ， 根 据 灰 度 分 布 的 相似 性 进行 区 域 合并 。 
3) 设 定 终止 准则 ， 通 过 反复 进行 步骤 2) 中 的 操作 将 各 个 区 域 依 次 合并 ， 直 到 满足 终止 


准则 。 


为 了 检测 灰 度 分 布 情况 的 相似 性 ， 采 用 下 面 的 方法 。 这 里 设 态 (XZ) 和 轧 (2X) 为 相 邻 的 两 
个 区 域 的 灰 度 直方 图 ， 亏 为 灰 度 值 变 量 ， 从 这 个 直方 图 求 出 累积 灰 度 直方 图 珈 (X) 和 





甩 (XY) ， 根 据 以 下 两 个 准则 ; 
GD Kolomogorov-Smirnov 检测 


max|C) 一 如 (| 


@@ Smoothed-Difference 检测 


守 刀 00- 丈 G9| 


区 


《8-37) 


〈8-38) 


如 果 检 测 结果 小 于 给 定 的 阔 值 ， 就 把 两 个 区 域 合并 。 这 里 灰 度 直方 图 MKX) 的 累积 灰 度 





直方 图 末 (X) 被 定义 为 


x 
万 OO = HACodr 


在 离散 情况 下 


对 上 述 两 种 方法 有 两 点 值得 说 明 ; 
@ 小 区 域 的 尺寸 对 结果 影响 较 大 。 尺 寸 太 4 
区 域 形状 不 理想 ， 小 的 目标 可 能 漏 掉 。 


包 
HOCO= > AD nondx (8-39) 
气 


、\， 检 测 可 靠 性 降低 ， 尺寸 太 大 ， 则 得 到 的 





@ 式 (8-38) 比 式 (8-37) 在 检测 直方 图 相似 性 方面 较 好 ， 因 为 它 考虑 了 所 有 灰 度 值 。 


(3) 基于 区 域 形状 


在 决定 对 区 域 的 合并 时 ， 也 可 以 利用 对 目标 形状 的 检测 结果 ， 常 用 的 方法 有 两 种 : 


1) 把 图 像 分 割 成 灰 度 固定 的 区 域 ， 设 两 相 

线 两 侧 灰 度 差 小 于 给 定 值 的 那 部 分 设 为 工 ， 如 果 
min{fpP 

则 合并 两 区 域 。 


区 域 的 周 长 为 启 和 户 ， 把 两 区 域 共 同 边界 
(也 为 预定 阔 值 
> 五 (8-40) 





2) 把 图 像 分 割 成 灰 度 固定 的 区 域 ， 设 两 邻接 区 域 的 共同 边界 长 度 为 B， 把 两 区 域 共同 


边界 线 两 侧 灰 度 差 小 于 给 定 值 的 那 部 分 长 度 设 为 


再 





则 合并 两 区 域 。 


Z， 如 果 《〈 也 为 预定 阔 值 ) 


从 (8-41) 


上 述 两 种 方法 的 区 别 是 : 第 一 种 方法 是 合并 两 相 邻 区 域 的 共同 边界 中 对 比 度 较 低 部 分 占 
整个 区 域 边 界 份额 较 大 的 区 域 ， 第 二 种 方法 则 是 合并 两 相 邻 区 域 的 共同 边界 中 对 比 度 较 低 部 


分 比较 多 的 区 域 。 
下 述 为 区 域 生长 的 实例 。 








图 8-17b 是 区 域 生长 的 结果 。 





图 8-17a 是 细胞 图 像 ， 在 细胞 体 上 手工 选择 一 种 子 点 ， 采 用 区 域 灰 度 差 的 生长 准则 ， 





8.3.1 节 介绍 的 区 域 生长 法 是 先 从 单个 种 子 像素 开始 通过 不 断 接 纳 新 像素 ， 最 后 得 到 整 
个 区 域 。 分 裂 合并 法 是 从 整 幅 图 像 开 始 通过 不 断 分 裂 得 到 各 个 区 域 。 在 实际 中 ， 常 先 把 图 像 
分 成 任意 大 小 且 不 重 登 的 区 域 ， 然 后 再 合并 或 分 裂 这 些 区 域 ， 以 满足 分 割 的 要 求 。 





在 这 类 方法 中 ， 常 需要 根据 图 像 的 统计 特性 


设 定 图 像 区 域 属性 的 一 致 性 测度 ， 其 中 最 常 


用 的 测度 多 基于 灰 度 统计 特征 ， 如 同 质 区 域 中 的 方差 〈Variance Within Homogeneous Region， 
VWHR)。 算 法 根据 VWHR 的 数值 合并 或 分 裂 各 个 区 域 。 为 得 到 正确 的 分 割 结果 ， 需 要 根据 
先 验 知识 或 对 图 像 中 噪声 的 估计 来 选择 VWHR， 它 选择 的 精度 对 算法 性 能 影响 很 大 。 

假设 以 VWHR 的 一 致 性 测度 ， 令 F(R) 代表 趋 于 区 域 R 内 的 VWHR 值 ， 阔 值 设 为 7， 


下 面 介 绍 一 种 利用 图 像 四 叉 树 〈Quad Tree，QT) 


表达 方法 的 简单 分 裂 合并 算法 。 如 图 8-18 





MATLAB_ 数字 图 你 处 理 _ 








所 示 ， 设 忆 代表 整个 四 方形 图 像 区 域 ， 从 最 高 层 开始 ， 如 果 FCRo) >7 ， 就 将 其 四 等 分 ， 得 
到 四 个 子 区 域 尺 。 如 果 F(R)>7 ， 则 将 该 区 域 四 等 分 。 如 此 类 推 ， 直 到 尺 , 为 单个 像素 。 


(o) 0 层 
全 g 四 内 ” 


一 Seroiean 


图 8-18 简单 的 区 域 分 裂 过程 
如 果 仅 仅 使 用 分 裂 ， 最 后 有 可 能 出 现 相 邻 的 两 个 区 域 属于 同一 个 目标 ， 但 并 没有 合并 
成 一 个 整体 。 为 解决 这 个 问题 ， 每 次 分 裂 后 允许 其 以 后 继续 分 裂 或 合并 。 合 并 过 程 只 合并 
相 邻 的 区 域 ， 且 合并 后 组 成 的 新 区 域 要 满足 一 致 性 测度 ， 即 相 邻 的 R 和 R ， 如 果 
FRIUR)) 和 7 ， 则 将 二 者 合并 。 
下 面 用 qtdecomp() 函 数 实现 四 又 树 分 解 。 
程序 代码 如 下 : 























Timread(eighttif) 
JI(1:128,1:128); 
S=qtdecomp(10.2); 
figure,imshow(D); 
figureimshow(full(S) 


程序 执行 结果 如 图 8-19 所 示 。 





图 8-19 四 又 树 分 解 
al) 原始 图 像 b) 四 又 树 分 解 的 结果 
综 上 所 述 ， 分 裂 合并 算法 的 步骤 可 以 简单 描述 如 下 : 
1) 对 于 任意 一 个 R ， 如 果 F(R)>T ， 则 将 其 分 裂 成 互 不 重 登 的 四 等 分 。 
2) 对 相 邻 区 域 尺 和 Ri ， 如 果 F(CR UR)) 短 7 ， 则 将 二 者 合并 。 
3) 如 果 进 一 步 的 分 裂 或 合并 都 不 可 能 了 ， 则 终止 算法 。 














1. 水 域 分 割 的 基本 原理 

水 域 分 割 ， 又 称 为 Watershed 变换 ， 是 一 种 借鉴 了 形态 学 理论 的 分 割 方法 ， 其 本 质 上 是 G) 
利用 图 像 的 区 域 特 性 来 分 割 图 像 的 ， 它 将 边缘 检测 与 区 
域 生 长 的 优点 结合 起 来 ， 能 够 得 到 单 像素 宽 、 连 通 、 封 积 水 盆 
闭 、 且 位 置 准 确 的 轮廓 。 水 域 分 割 的 基本 思 人 于 局 
部 极 小 值 和 积 水 盆 〈Catchment Basin) 的 概念 。 积 水 盆 
是 地 形 中 局 部 极 小 点 的 影响 区 (Influence Zones)， 水 平 
面 从 这 些 局 部 极 小 值 处 上 涨 ， 在 水 平面 浸没 地 形 的 过 程 
中 ， 每 一 个 积 水 盆 被 筑 起 的 “ 坝 ” 所 包围 ， 水 
防止 不 同 积 水 盆 里 的 水 混合 到 一 起 。 在 地 形 
水 中 之 后 ， 这 些 筑 起 的 坝 就 构成 了 分 水 岭 。 
图 8-20 所 示 。 

现在 将 水 域 的 概念 应 用 到 图 像 分 割 中 ， 假 设 待 分 割 的 图 像 由 目标 和 背 
像 的 背景 和 目标 的 内 部 区 域 将 对 应 梯度 图 中 
0 称 梯 度 图 像 中 具有 均匀 低 灰 度 值 的 区 域 为 极 小 值 区 域 〈 一 般 分 布 在 目标 内 部 及 

。 水 面 从 这 些 极 小 区 域 开 始 上 涨 ， 当 不 同 流域 中 的 水 面 不 断 升 高 到 将 要 汇合 在 -起 时 
《 标 边界 处 )， 便 筑 起 一 道 堤 坝 ， 最 后 得 到 由 这 些 坝 组 成 的 分 水 线 ， 图 像 也 就 完成 了 分 
割 。 图 8-21 是 一 个 水 域 分 割 实例 。 













小 值 


7 
个 过 程 如 图 8-20 ”地形 浸没 过 程 说 明 





成 ， 这 样 ， 图 
位置 ， 而 目标 边缘 则 对 应 了 梯度 图 中 















图 8-21 水域 分 割 


al 原始 图 像 b) 经 典 的 Canny 梯度 c) 梯度 图 像 的 流域 分 界线 d) 分 割 结果 














2.， 基 于 标记 的 Watershed 变换 

由 于 待 分 割 的 图 像 中 存在 噪声 和 一 些微 小 的 灰 度 值 起 伏 波 动 ， 在 梯度 图 像 中 可 能 存在 许 
多 假 的 局 部 极 小 值 ， 如 果 直 接 对 梯度 图 像 进 行 生 长 会 造成 过 分 割 的 现象 。 即 使 在 Watershed 变 
换 前 对 梯度 图 像 进行 滤波 ， 存 在 的 极 小 点 也 往往 会 多 于 原始 图 像 中 目标 的 数目 ， 因此 必须 加 以 
改进 。 实 际 中 应 用 Watershed 变换 的 有 效 途 径 是 首先 确定 图 像 中 目标 的 标记 或 种 子 
行 生长 ， 并 且 在 生长 的 过 程 中 仅 对 具有 不 同 标记 的 标记 点 建筑 防止 ; 流 汇合 的 坝 ， 
岭 ， 这 就 是 基于 标记 的 Watershed 变换 。 基 于 标记 的 Watershed 变换 大 体 可 分 为 3 个 步骤 

1) 对 原始 图 像 进 行 梯度 变换 ， 得 到 梯度 图 。 

2) 用 合适 的 标记 函数 把 图 像 中 相关 的 目标 及 背景 标记 出 来 ， 得 到 标记 图 。 

3) 将 标记 图 中 的 相应 标记 作为 种 子 点 ， 对 梯度 图 像 进 行 Watershed 变换 ， 产 生 分 水 岭 。 

由 于 目标 标记 的 正确 与 否 直 接 影响 分 割 结果 ， 所 以 利用 Watershed 变换 进行 图 像 分 割 的 
关键 是 标记 提取 。 到 目前 为 止 ， 标 记 提取 还 没有 一 个 统一 的 方法 ， 一 般 依 赖 于 图 像 的 先 验 知 
识 ， 如 图 像 极 值 、 平 坦 区 域 或 纹理 等 。 图 8-22a 一 d 是 一 种 利用 直方 图 峰值 特性 提取 标记 的 
方法 ， 算 法 将 直方 图 中 的 3 个 峰 所 对 应 的 像素 作为 标记 ， 分 成 对 应 核 仁 、 细 胞 核 及 背景 3 类 
目标 ， 以 这 些 标记 点 作为 种 子 ， 在 梯度 图 上 进行 水 域 生 长 ， 图 8-22e 为 水 域 分 割 的 结果 。 

















图 8-22 ”利用 直方 图 提取 标记 的 水 域 分 割 结果 
a 原始 图 像 b) 直方 图 。) 提取 出 的 标记 “d) Canny 梯度 e) 水 域 分 割 的 结果 


8.4 边界 跟踪 与 直线 检查 


边界 跟踪 技术 是 重要 的 图 像 分 割 方法 。 它 分 为 两 类 : 一 类 是 区 域 跟踪 ， 这 是 基于 区 域 的 
图 像 分 割 方法 ， 另 一 类 是 曲线 跟踪 ， 这 是 基于 边界 的 图 像 分 割 方法 。 
由 于 直线 通常 对 应 重要 的 边缘 信息 ， 直 线 提取 是 计算 机 视觉 中 一 项 非常 重要 的 技术 。 如 













在 车 辆 自动 驾驶 技术 分 析 中 ， 道 路 的 提取 需要 有 效 地 提取 直 的 道路 边缘 ， 在 航空 照片 分 析 
中 ， 直 线 对 应 于 重要 的 人 造 目 标的 边缘 。 因 此 ， 把 直线 提取 单独 抽出 来 进行 研究 很 有 意义 。 





















则 的 确定 对 曲线 跟踪 的 结果 影响 很 大 。 





满足 检测 准则 的 









一 个 “现在 点 ” 〈 边 缘 点 ) 出 发 ， 用 跟踪 准则 检查 

被 接受 为 新 的 “现在 点 ”并 做 上 标记 。 在 跟踪 过 程 人 ) 
曲线 的 分 支点 或 几 条 曲线 的 交点 ， 取 满足 跟踪 准则 的 
， 继 续 进行 跟踪 ， 而 将 其 余 满足 跟踪 准则 的 各 邻 点 存储 


后 继续 跟踪 用 ; 当 跟 踪 过 程 中 的 “现在 点 ”的 邻 点 都 不 满足 跟踪 准则 时 ， 则 该 分 支 
。 当 全 部 分 支点 处 的 全 部 待 跟踪 的 点 均 已 跟踪 完毕 后 ， 该 次 跟 
了 可 能 使 用 灰 度 值 、 梯 度 模 值 之 外 ， 还 可 能 使 用 平滑 性 要 求 。 另 外 ， 起 始点 





阳 结 束 。 


称 为 区 域 生长 ， 它 的 基本 思路 是 : 在 图 像 中 寻找 满足 某 种 检测 准则 〈 如 灰 度 门 
限 ) 的 点 ， 对 任意 


一 个 这 样 





检查 它 的 全 部 邻 点 ， 把 满足 跟踪 准则 的 任何 邻 点 和 已 检测 的 


点 合 ， 从 而 产生 小 块 目标 区 域 ， 然 后 再 检查 该 区 域 的 全 部 邻 点 ， 并 把 满足 跟踪 






踪 准 则 为 止 ， 则 此 块 
后 用 检测 准则 继续 寻找 ， 当 找到 满足 检测 准则 且 不 属于 任何 已 生成 的 区 域 的 
一 个 区 域 的 生长 ， 按 这 种 方法 进行 ， 直 到 没有 满足 检测 准则 的 像素 点 为 止 。 














MAILAB 提供 了 两 个 边界 跟踪 函数 : bwtraceboundary() 函 数 和 bwboundaries0) 函 数 ， 其 


功能 见 表 8-2。 


表 8-2 边界 跟踪 函数 介绍 














函数 名 称 用 法 
bwtraceboundary 采用 基于 曲线 跟踪 的 策略 ， 需 要 给 定 搜索 起 始点 和 搜索 方向 ， 返 回 过 该 起 点 的 一 条 边界 
bwboundaries 属于 区 域 跟踪 算法 ， 能 给 出 二 值 图 像 中 所 有 物体 的 外 边界 和 内 边界 








下 面 对 它们 的 使 用 进行 具体 说 明 并 给 出 实例 。 


1.，Bwtraceb 


oundary() 函 数 


其 语法 格式 如 下 : 

量 B=bwtraceboundary(BW, P, fstep) 

@@ B=bwtraceboundary(BW, P, fstep, conm) 
@@ B=bwtraceboundary(…, N, dir) 

其 参数 的 含义 见 表 8-3。 


表 8-3 bwtraceboundary() 函 数 中 参数 的 含义 



































参数 名 称 ER 
BW 图 像 矩 阵 ， 值 为 0 的 元 素 视 为 背景 像素 点 ， 非 0 元 素 视 为 待 提取 边界 的 物体 
E 2x1 维 矢量 ， 两 个 元 素 分 别 对 应 起 始点 的 行 坐 标 和 列 坐标 
fstep 字符 串 ， 指 定 起 始 搜索 方向 ， 它 的 取 值 与 方向 的 对 应 关系 如 图 8-23 所 示 ， 见 表 8-4 
conn 指定 搜索 算法 所 使 用 的 连通 方法 ， 具 体 参数 设置 见 表 8-4 
N 指定 提取 的 边界 的 最 大 长 度 ， 即 这 段 边 界 所 含 的 像素 点 最 大 数目 
dir 字符 串 指 定 搜索 边界 的 方向 ， 具 体 参数 设 痪 见 表 8-4 
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图 8-23 fstep 的 取 值 和 含义 


表 8-4 dir、conn、fstep 参数 设置 

































































参数 描述 
Save 在 cloekwise 方向 搜索 《默认 值 》 
counterclockwise' 在 counterclockwise 方向 拓 
4 4 连通 (上 、 下 、 左 、 右 ) 
区 8 8 连通 (上 、 下 、 左 、 右 、 右 上 、 右 下 , 左上 、 左下 ) 
m 从 图 像 上 方 开始 搜索 
攻 从 图 像 下 文 开 始 搜索 
沟 : 从 图 像 右 方 开始 搜索 
WwW 从 图 像 左 方 开始 搜索 
人 ANE 从 图 像 右上 方 下 
SP 从 图 像 右 下 方 开 人 
| Nw 从 图 像 左上 方 开始 搜索 
SW 从 图 像 左下 方 开始 搜索 
输出 中 的 B 为 一 个 Cx2 维 矩阵 ， 其 中 2 为 所 提取 的 边界 长 度 〈 即 边界 所 含 像素 点 的 数 
目 )， 好 矩阵 中 存储 边界 像 9 行 坐 标 和 列 坐标 。 





使 用 bwtraceboundary() 函 数 对 tape.png 图 像 进 行 边界 提取 ， 如 图 8-24 所 示 





a) b) ) 
图 8-24 bwtraceboundary0) 函 数 的 应 用 


a) 原始 图 像 bj 二 值 图 像 “) 应 用 结 





程序 代码 如 下 : 








figure,imshow(RGB) 





I=rgb2gray(RGB); 将 彩色 图 像 转 换 成 灰 度 图 像 

threshold=graythresh(D); % 计 算 将 灰 度 图 像 转换 成 二 值 图 像 所 需 的 门限 
BW=im2bw(Lthreshold); % 将 灰 度 图 像 转换 为 二 值 图 像 

figure,imshow(BW) 人 ) 
dim=size(BW); 

col=round(dim(2)/2)-90; 呈 计算 起 始 列 坐 标 

row=find(BW(,coD,D; %% 计 算 起 始点 行 坐标 





connectivity=8; 
num_points=180; 
contour=bwtraceboundary(BW,[row,coll"Nvconnectivity,num_points)j; 。 % 提 取 边 界 
figureimshow(RGB); 
hold on; 
plot(contour(:,2),contour(:,1D,g "LineWidth,2); 
2. bwboundaries() 函 数 
其 语法 格式 如 下 : 
wboundaries(BW) 
=bwboundaries(BW, conn) 
B= bwboundaries(BW, conn, options) 
[B,L]= bwboundaries(…) 
[B,L,N,A]= bwboundaries(… 
其 中 ，BW、conn 与 表 8-3 中 意义 相同 ， 其 他 参数 的 含义 见 表 8-5。 








SB eg@ @ 





表 8-5 bwboundaries() 函 数 中 参数 的 含义 






































参数 名 称 含 长 

为 字符 囊 ， 取 值 为 Woles 或 noholes， 其 中 前 者 为 默认 值 ， 它 指定 算法 既 搜 索 物 体 的 外 边界 、 也 搜索 物体 的 内 
2 边界 〈 即 洞 的 边界 )， 后 者 使 算法 只 搜索 物体 的 外 边界 
1 该 图 像 被 边界 所 划分 的 区 域 ， 包 括 物体 和 它 是 一 个 整数 矩阵 ， 与 原始 图 像 具 有 相同 的 维 数 ， 元 

直 代 表 了 该 位 置 上 的 像素 点 所 在 区 域 的 编号 ， 属 于 同一 个 区 域 的 像素 点 对 应 的 元 素 值 相同 
N 为 该 图 像 被 边界 所 划分 成 的 区 域 的 数目 ， 因 此 N=max(L(:)) 
被 划分 的 区 域 的 邻接 关系 ,， 个 NxN 维 逻 辑 其 中 N 是 被 划分 区 域 的 数目 ，4(iy) =!1 说 明 

个 区 域 与 第 / 个 区 域 存在 邻接 关系 ， 且 第 1 个 区 域 ( 子 区 域 ) 在 第 / 个 区 域 ( 父 区 域 ) 内 








使 用 bwboundaries() 函 数 对 treestif 图 像 中 不 同 的 区 域 标志 不 同 的 颜色 ， 如 图 8-25 所 示 。 





图 8-25 bwboundariesO 函 数 的 应 用 
a 原始 图 像 b) 标志 区 域 








clear all 


[=imread(trees:tif; 
figure,imshow(D) 
BW=im2bw(Lgraythresh(D); %% 生 成 二 值 图 像 
% 提 取 边 界 ， 并 返回 边界 元 胞 数组 B 和 区 标 
[B.Lj=bwboundaries(BW,noholes)); 
figure,imshow(label2rgb(L,Q@jet[.5 .5 .53D)) % 以 不 同 颜色 标志 不 同 的 区 域 
hold on 
fork=l:length(B) 

boundary=Bfky; 

plot(boundary(:,2),boundary(:,1D)"W'LineWidth,2) ”% 在 图 像 上 吞 画 边界 
end 


ES5 直线 提取 算 | 


由 于 直线 具有 不 同 于 一 般 曲线 的 特征 ， 因 此 它 的 提取 方法 也 与 一 般 的 边界 检测 方法 
不 同 。 

1. Hough 变换 的 基本 原理 

Hough 变换 是 最 常用 的 直线 提取 方法 ， 它 的 基本 思想 是 :将 直线 上 每 一 个 数据 点 变换 为 
参数 平面 中 的 一 条 直线 或 曲线 ， 利 用 共 线 的 数据 点 对 应 的 参数 曲线 相交 于 参数 空间 中 一 点 的 
关系 ， 使 直线 的 提取 问题 转化 为 计数 问题 。Hough 变换 提取 直线 的 主要 优点 是 受 直线 中 的 间 
际 和 噪声 影响 较 小 。 

具体 地 说 ， 对 于 满足 直线 方程 >= ar+z 的 某 一 个 数据 点 (xo,)o) ， 对 应 参数 平面 (o, 六 上 
的 一 条 直线 冰 = 加 -axo ， 而 来 自 于 同一 条 直线 = aox+ 沁 上 的 所 有 数据 点 对 应 的 参数 平面 上 
的 直 相交 于 真实 的 参数 点 (oo, 名 ) 。 另 外 ， 为 了 避免 垂直 直线 斜率 无 穷 大 的 问题 ， 在 应 
用 时 通常 采用 直线 的 极 坐标 方程 p = xcos+ )sing ， 此 时 参数 平面 为 (p,6) 平面 。 图 8-26 
给 出 了 Hough 变换 基本 原理 的 示意 图 。 


< 
Co) (pe) 
@@ 
一 证 
计 现 
引 b) 


图 8-26 ”Hough 变换 基本 原理 











汪 Geg) 室 间 到 (a 妇 空间 的 交换 “b) (xu) 室 间 到 (mg 空间 的 交换 
在 算法 实现 中 ， 考 虑 到 噪声 的 影响 和 参数 空间 离散 化 的 需要 ， 求 交点 的 问题 成 为 一 个 累 
加 器 问题 。 算 法 步骤 如 下 : 
1) 适当 地 量化 参数 空间 。 





2) 假定 参数 空间 的 每 一 个 单元 都 是 一 个 累加 器 。 
3) 累 加 器 初始 化 为 零 。 
4) 对 图 像 空间 的 每 一 点 ， 在 其 所 满足 参数 方程 对 应 的 累加 器 上 加 1。 


2. Hough 变换 的 MATLAB 实现 


5) 累加 器 陈列 的 最 大 值 对 应 模型 的 参数 。 


MAILAB 提供 了 3 个 与 Hough 变换 有 关 的 函数 ， HoughO 函 数 ，Houghpeaks() 函 数 和 
Houghlines() 函 数 ， 其 作用 见 表 8-6。 


表 8-6 ”Hough 变换 函数 














函数 名 称 用 法 
Hough 对 图 像 进行 Hough 变换 
Houghpeaks 用 来 提取 Hough 变换 后 参数 平面 上 的 峰值 点 
Houghlines 用 于 提取 参数 平面 上 的 峰值 点 对 应 的 直线 








(1) Hough(O) 函 数 


HoughO 函 数 对 输入 图 像 进行 标准 Hough 变换 ， 采 用 极 坐标 方程 P= xcos2g+ sing 中 的 
直线 参数 (p,6) 作为 参数 平面 。 

其 语法 格式 如 下 : 

@ [H, theta, rholj=hough(BW) 

@@ [H, theta, rhol= hough(BW, paraml, vall, param2, val2) 

其 中 ，BW 为 输入 的 二 值 图 像 。param1，vall 和 param2，vall 共同 制定 参数 平面 的 离散 
度 。Hough(O) 函 数 中 参数 的 含义 见 表 8-7。 


表 8-7 ”Hough() 函 数 中 参数 的 含义 








参数 描述 





7ThetaResolution' val 为 6 轴 的 单元 大 小 ， 它 是 介 于 0 一 0” 的 标量 





val 为 p 轴 的 单元 大 小 ， 它 是 介 于 0 一 normtfsize(BW)) ( 即 以 像素 点 数目 衡量 图 
像 对 角 线 的 长 度 ) 的 标量 


RhoResolution 











Hough() 函 数 输出 中 的 互 为 参数 平面 的 计数 结果 矩阵 。 维 数 为 N。x Ne ， 其 中 ，No 为 避 
轴 离 散 后 的 单元 数目 ， Ne 为 6 轴 离散 后 的 单元 数目 。 互 矩阵 中 的 元 素 值 是 参数 平面 上 对 应 
单元 的 计算 结果 。theta 为 Ne x1 维 矢量 ， 指 示 @ 轴 各 个 单元 对 应 的 9 值 。rho 为 No x1 维 矢 
量 ， 指 示 忆 轴 各 个 单元 对 应 的 记 值 。 


(2) Houghpeaks(0) 函 数 


Houghpeaks() 函 数 用 于 提取 Hough 变换 后 参数 平面 上 的 峰值 点 。 
其 语法 格式 如 下 : 

@ Peaks=houghpeaks(H, numpeaks) 

@ Peaks=houghpeaks(…, paraml,vall,param2,val2) 











其 参数 的 含义 见 表 8-8。 


param 和 val 参数 对 用 来 指定 寻找 峰值 的 门限 或 峰值 对 周围 像素 点 的 抑制 范围 。 具 体 取 
值 及 意义 见 表 8-9。 由 于 噪声 的 影响 ， 一 个 真实 的 参数 点 很 可 能 和 它 周围 的 点 同时 超过 峰值 
门限 ， 而 实际 上 只 需 在 这 个 小 区 域内 提取 出 一 个 峰值 点 ， 因 此 在 提取 出 一 个 极 大 值 点 后 ， 算 
法 将 它 的 领域 内 的 计数 器 都 置 为 0， 这 个 领域 即 由 [MMX NM 指定 的 抑制 区 ，[AM NM] 的 默认 值 是 大 
于 或 等 于 size(H)/50 的 最 小 奇数 对 。 


表 8-8 Houghpeaks() 函 数 中 参数 的 含义 


























参数 名 
阳 HoughO 函 数 的 输出 ， 参 数 平面 的 计数 结果 矩阵 

numpeaks 指定 要 提取 的 峰值 数目 ， 默 认 值 为 1 

N 为 该 图 像 被 边界 所 划分 成 的 区 域 的 数目 ， 因 此 N=max(LG)) 

Peaks @x2 维 矩阵 ， 其 中 2 为 提取 的 峰值 数目 ，Peaks 的 第 q 行 分 别 存储 第 q 个 峰值 的 行 坐标 和 列 坐标 

表 8-9 Houghpeaks() 函 数 中 参数 的 含义 
参数 描述 
Threshold val 参数 指定 峰值 门限 ， 可 以 是 任意 正 实数 ， 默 认 值 为 05xmax(H()) 
2 NEHoodSize。 | val=[A4 M， 其 中 两 个 元 素 M 和 N 都 是 正 奇数 ，M 和 N 共同 指定 峰值 周围 抑制 区 的 大 小 











(3) Houghlines() 函 数 
HoughlinesO) 函 数 根据 Hough 变换 的 结果 提取 图 像 中 的 直线 。 


其 语法 格式 如 下 : 


@ Lines=houghlines(BW, theta, rho, peaks) 

@ Lines=houghlines(…,paraml, vall, param2, val2) 

其 中 ，BW 与 HoughO 函 数 的 输入 BW 相同 ， 为 二 值 图 像 ，theta 和 mo 为 HoughO) 函 数 
返回 的 输出 ， 指 示 29 轴 和 P 轴 各 个 单元 对 应 的 值 。peaks 为 HoughpeaksO 函 数 返 回 的 输出 ， 指 
示 峰 值 的 行 坐标 和 列 坐标 ，Houghlines() 函 数 将 根据 这 些 峰 值 提 取 直 线 。param 和 val 是 参数 
对 ， 指 定 是 否 合并 或 保留 直线 段 的 相关 函数 。 其 参数 的 具体 含义 见 表 8-10。 


表 8-10 “Houghlines() 函 数 中 参数 的 含义 














参数 描述 
本 val 指定 合并 后 的 直线 被 保留 的 门限 长 度 ， 长 度 小 于 val 给 定 的 门限 值 的 直线 被 人 
去 ， 门 限 长 度 的 默认 值 为 40 
FillGap val 指定 直线 被 合并 的 门限 间隔 ， 若 两 条 斜率 和 截 距 均 相同 的 直线 段 间 隔 小 于 val 给 
芝 定 的 值 ， 则 它们 被 合并 为 一 条 直线 ， 门 限 间隔 的 默认 值 为 20 





输出 中 的 Lines 为 结构 数组 ， 数 组 长 度 为 提取 出 的 直线 的 数目 。 结 构 数组 的 每 个 元 素 存 


储 一 条 直线 段 的 相交 





息 ， 它 包括 的 域 见 表 8-11。 





表 8-11 输出 Lines 中 参数 的 意义 





























域 名 意 自 
pointl 元 矢量 [xy] 指 定 直线 段 一 个 端点 的 行 坐 标 和 列 坐标 
point 元 矢量 [xy] 指 定 直线 段 另 一 个 端点 的 行 坐标 和 列 坐标 G 
thetaAngle 该 线段 对 应 的 9 人 ， 
rho 该 线段 对 应 的 p 值 
3. MATLAB 实用 


寻找 图 像 中 的 直 





程序 





或 段 和 其 中 最 长 的 段 ， 如 图 8-27 所 示 。 





b 台 


图 8-27 Hough 检测 直线 的 应 用 


a) 原始 图 像 b) Hough 变换 c) 画 直 线 并 计算 长 度 
代码 如 下 : 


clc; 
clear all; 
I=imread('circuittif); 
figurejimshow(D) 
rotI=imrotate(L.33,crop ); 
BW=edge(rotlvcanny) 
[HT.R]=hough(BW); 
figure,imshow(H,[],XData,T,YData,R,InitialMagnification ,fit); 
xlabel(wtheta'),ylabel(rho7; 
axis on, axis normal,hold on; 
P=houghpeaks(H,S,threshold',ceil(0.3*max(HGC)7D77; 
xX=TOGC2))y=RCGP(C, TD 
plot(xy,svcolor*white; 
lines=houghlines(BW,T,R,P,FillGap',5,MinLength ,7); 
figure,imshow(rotD)， 
hold on; 
max_len=0; 
fork=l:length(lines) 

xy=[lines(k).pointl;lines(k).point2]; 

plotxy(:,1D)xy(.2)"LineWidth， 





'Colorvgreeny; 


2 





end 











plotCxy(L,Dxy(1 


LineWidth,2,Colorvyellowy; 
plot(xy(2.Dxy neWidth,2,Colorvred'; 
len=normtlines(k).pointl-lines(lo.point2); 
iflen>max_len) 





max_len=len; 
xy_long=xy; 
end 


plotxy_long(:,1)xy_long(:2),LineWidth,2,Colorvcyan) 


8.5 ”基于 图 像 分 割 的 图 像 分 析 


MATLAB 7. 0 图 像 处 理工 具 箱 提供 了 几 个 基于 图 像 分 割 的 分 析 示 例 ， 通 过 对 这 几 个 示例 
的 分 析 与 理解 ， 可 以 加 深 
割 相关 函数 的 熟 
检测 和 图 像 粒 度 





图 像 分 割 的 理解 ， 同 时 也 能 加 深 对 MATLAB 7.0 提供 的 图 像 分 
为 以 后 的 图 像 分 析 处 理 葛 定 良好 的 基础 。 这 里 ， 将 以 基于 图 像 分 割 细胞 
例 进 行 说 明 。 






通过 图 像 分 割 检 








测 细胞 ] 


细胞 检测 是 生物 学 和 医学 研究 中 最 基本 的 步骤 ， 而 通过 图 像 分 割 来 检测 是 现在 常用 的 最 
直接 的 计算 
整个 检 疯 
(1) 图 像 读 入 


方法。 


主要 包括 以 下 几 个 部 分 ， 






4 


Jimread('cellLtif); 


figure,imshow(D; 


(2) 检测 完整 的 细胞 

如 图 8-28a 所 示 ， 图 像 中 存在 两 个 细胞 ， 只 有 一 个 完整 的 ， 需 
出 来 。 由 于 目标 图 像 与 背 
此 ， 采 用 Sobel 算 子 





将 这 个 完整 的 细胞 分 割 
有 有 较 大 的 区 别 ， 可 以 利用 灰 度 的 梯度 信息 来 实现 图 像 分 割 。 为 
实现 边缘 提取 ， 边 缘 提 取 效 果 如 图 8-28b 所 示 。 











图 8-28 ”原始 图 像 及 边缘 提取 结果 
引 原始 图 像 b) 边缘 提取 效果 





BW=edge(L'sobelv(graythresh(D*.1)); 
figureimshow(BW) 


(3) 填补 缝隙 





由 检测 效果 图 8-28b 可 以 看 到 ， 虽 然 edge() 函 数据 取 了 图 像 的 大 概 轮 廓 ， 作 在 他 ) 
在 断裂 的 情况 ， 没 有 完整 而 精确 地 描绘 出 细胞 的 轮廓， 在 这 里 ， 可 以 通过 stel0 函 数 利用 线 ” 辐 
性 的 结果 函数 对 边缘 进行 脱 胀 操作 ， 填 补 边缘 细 阶 。 





Se90=strel(line',3,90); 


(4) 膨胀 
用 imdilate0) 函 数 对 图 像 进 行 膨 胀 操作 ， 膨 胀 结果 如 图 8-29a 所 示 





BWsidl=imdilate(BW,[se90,se0]); 
figure,imshow(BWsid1)， 
(5) 填充 
脱 胀 
利用 imfill0 函 数 对 这 些 孔 际 


训 图 像 精 确 地 显示 了 细胞 的 外 围 轮廓 ， 但 是 在 细胞 内 部 还 有 
进行 填充 ， 填 充 结果 如 图 8-29b 所 示 。 








BWdfill=imfill(BWsidl,holes); 
figure,imshow(BWdfiD) 








图 8-29 “ 脱 胀 与 





(6) 移 除 与 边界 连通 的 目标 
至 此 ， 可 以 对 感 兴趣 的 细胞 进行 成 功 分 割 ， 但 是 画面 上 还 有 其 他 物体 ， 可 以 通过 
imeclearborder(O) 函 数 来 清除 与 边界 连通 的 物体 ， 得 到 如 图 8-30 所 示 的 分 割 结 果 。 





BWbord=imclearborder(BWdfill,4); 
figure,imshow(BWbord) 
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图 8-30 分割 结 果 


避 分 割 b 平滑 






对 于 分 割 的 结果 ， 边 缘 不 是 很 光滑 ， 需 要 利用 菱形 结构 元 素 对 图 像 进行 平 滑 处 理 。 


seD=strel(diamond',1T); 
BWfinal=-imerode(BWbord,seD); 
BWfinal=imerode(BWfinalseD); 
figure,imshow(BWfinalD) 


然后 在 原 图 上 以 轮廓 线 标 出 细胞 的 轮廓 ， 至 此 ， 细 胞 的 检测 
为 标示 结果 。 
程序 代码 如 下 : 





完成 了 ， 如 图 8-31 所 示 


BWoutline=bwperim(BWfinal; 
Segout-1; 
Segout(BWoutline)-255; 
figure,imshow(Segou) 





像 粒 度 


此 应 用 示例 是 检测 如 图 8-32 所 示 图 像 中 米粒 的 分 布 情况 ， 即 统计 图 像 中 米粒 的 大 小 及 
其 所 占 的 比例 。 





图 8-31 分 割 结果 标记 图 8-32 rice 图 像 








1) 读 入 图 像 。 
T=imread(rice.png)); 
figure,imshow(D) 
2) 将 图 像 数 据 转换 为 双 精 度 类 型 进行 计算 ， 这 样 才能 充 公 发 挥 MATLAB 语言 进行 向 名 
量 处 理 的 特长 ， 并 将 图 像 的 精确 度 范围 调节 为 [0 1]， 即 设置 为 全 部 灰 度 范围 。 调 整 后 图 像 
如 图 8-33 所 示 。 





图 8-33 ”调整 数据 类 型 


a) imadjust 运算 结果 “b) 转换 为 双 精度 及 灰 度 范围 


clahel=adapthisteq(I,NumTiles'[10 10]); 
clahel-imadjust(claheD); 
figurejimshow(claheD); 
glI=imadjust(im2double(D,[,[0 1]); 
figure,imshow(gD) 


3) 从 图 8-33 可 以 看 出 ， 由 于 某 些 米粒 位 于 背景 较 亮 的 
地 方 ， 因 而 显得 很 模糊 ， 不 利于 直接 进行 检测 ， 为 此 ， 利 用 
一 个 高 帽 变换 来 消除 图 像 背景 中 那些 不 一 致 的 背景 亮度 ， 去 
除 效 果 如 图 8-34 所 示 。 






Se=strel(disk',10); 结构 元 素 


topI=imtophat(gLs 帽 





figure,imshow(topD) 


4) 这 样 ， 就 可 以 根据 变换 后 的 图 像 〈 见 图 8-34)， 分 析 原始 图 像 中 米粒 的 大 小 分 布 情 
况 了 。 这 里 利用 一 个 逐渐 变 大 的 结构 元 素 ， 不 断 对 变换 图 像 进行 形态 开启 操作 ， 并 统计 开启 
后 对 象 的 剩余 面积 ， 通 过 绘制 结构 元 素 的 大 小 和 剩余 面积 的 大 小 就 可 以 计算 出 各 种 大 小 的 米 
粒 在 图 像 中 占有 的 比例 。 米 粒 大 小 分 布 情况 如 图 8-35 所 示 。 





imread(rice.png); 
clahel=adapthisteq(L'NumTiles\[10 10]); 
clahel=imadjust(claheD; 
gl=imadjust(im2double(D),D,[0 1]); 











se=strel('disk,10); 

topl=imtophat(gLse); 

for counter=0:22 
remain=imopen(claheLstreldiskvcounter)); 


intensity_area(counter+TD)=sum(remain(:)); 
end 
figure,plot(intensity_areaym-*),grid on; 
xlabel(radius ofopening(pixels)); 
ylabel(pixel value sum of opened objects(intensity)); 


for counter-0:20 % 利 用 一 个 逐渐 变 大 的 结构 元 素 对 变换 图 像 进 行 形态 开启 操作 
remain=imopen(topl'streltdiskvcounter); 
surfarea(counter+1)-sum(remain(CJ); 

end 

figure,plot(surfaream-*),grid on; 

set(gca,'xtick,[02468 1012 14 16 18 20]); 

xlabel(radius ofopening(pixels)7; 

ylabel(surface area ofopened objects(pixels)); 


执行 程序 后 得 到 如 图 8-35 所 示 的 效果 。 

5) 从 图 8-35 所 示 的 曲线 可 以 看 出 ， 随 着 结构 元 素 的 增 大 ， 对 象 的 剩余 面积 发 生 锐 减 ， 
这 是 由 于 原始 图 像 中 含有 较 多 的 相同 大 小 星体 的 缘故 。 通 过 计算 两 次 形态 开启 操作 前 、 后 的 
斜率 〈 即 一 阶 偏 导 ) 就 可 以 估计 出 图 像 中 相同 大 小 米粒 所 占 的 比例 ， 结 果 如 图 8-36 所 示 。 
横 轴 为 米粒 半径 大 小 ， 纵 轴 表 示 两 次 形态 开启 操作 前 、 后 的 斜率 。 











图 8-35 米粒 大 小 分 布 情况 图 8-36 ”估计 图 像 中 相同 大 小 米粒 所 占 的 比例 


intensity_area_prime=diffintensity_area); 
plotintensity_area_primeym-*),grid on; 

set(gcavxtick,[0246 8 10 12 14 16 18 20 22]); 

xlabel(radius of snowflakes(pixels)); 

ylabelCSum of pixel values in snowflakes as a function ofradius); 





8.6 ”彩色 图 像 分 割 


彩色 图 像 分 割 是 数字 图 像 处 理 领域 中 一 类 非常 重要 的 图 像 分 析 技术 ， 在 对 图 像 的 研究 
和 应 用 中 ， 根 据 不 同 领域 的 不 同 需要 ， 在 某 一 领域 往往 仅 对 原始 图 像 中 的 某 些 部 分 感 兴 
趣 。 这 些 目标 区 域 一 般 来 说 都 具备 自身 特定 的 一 些 诸如 颜色 、 纹 理 等 性 质 ， 彩 色 图 像 的 分 
割 主要 根据 图 像 在 各 个 区 域 的 不 同 特性 ， 而 对 其 进行 边界 或 区 域 上 的 分 割 ， 并 从 中 提取 出 
所 关心 的 目标 。 

图 像 分 割 注重 对 图 像 中 的 目标 进行 检测 与 测量 ， 这 与 在 像素 级 对 图 像 进行 操作 的 图 像 处 
理 技术 ， 为 改善 图 像 视觉 效果 而 强调 在 图 像 之 间 所 进行 的 变换 是 有 所 区 别 的 。 通 过 对 图 像 的 
分 割 、 目 标 特征 的 提取 ， 可 将 经 初步 图 像 处 理 的 图 像 特征 向 量 提取 出 来 ， 并 将 原始 的 数字 图 
像 转化 成 为 一 种 有 利于 目标 表达 的 更 抽象 、 更 紧凑 的 表现 形式 ， 从 而 使 高 层 的 图 像 分 析 、 图 
像 理 解 以 及 计算 机 的 模式 自动 识别 成 为 可 能 。 多 年 来 ， 彩 色 图 像 分 割 技术 在 工业 自动 化 控 
制 、 遥 感 贺 测 、 微 生物 工程 以 及 合成 孔径 雷达 (SAR) 成 像 等 多 种 工程 应 用 领域 得 到 了 广泛 
的 应 用 。 


表达 颜色 的 色彩 空间 有 许多 种 ， 它 们 是 根据 不 同 的 应 用 目的 而 提出 的 。 下 面 将 围绕 彩色 
图 像 分 割 ， 介 绍 几 种 常用 的 色彩 空间 和 它们 的 特点 。 

最 常见 的 色彩 空间 是 红 绿 蓝 〈(Red、Green、Blue，RGB ) 空间 ， 它 是 一 种 矩形 直角 空间 
结构 的 模型 ， 是 通过 对 颜色 进行 加 运算 完成 颜色 综合 的 彩色 系统 。 它 用 R、G、B 三 个 基本 
分 量 的 值 来 表示 颜色 ， 它 是 面向 硬件 设备 的 〈 如 CRT 显示 器 )， 物 理 意义 明确 但 缺乏 直观 
感 。 与 它 对 应 的 是 深蓝 、 品 红 和 黄 的 CMY 空间 ， 主 要 用 于 非 发 射 式 显示 ， 如 彩色 打印 机 、 
绘画 等 。 

通过 对 不 同类 型 图 像 的 分 析 ， 有 人 经 过 大 量 试验 提出 可 用 由 R、G、B 经 过 线性 变换 得 
到 的 三 个 正 交 彩 色 特 征 来 进行 分 割 。 











1 =(R+G+B)/3 
LDL =(R-B)/2 或 D =(B-R)/2 
D =(2G-R-B)/4 
这 三 个 特征 中 ，D 是 最 佳 特征 ，D 是 次 佳 特征 ， 只 用 T 和 LE 作为 特征 ， 对 大 多 数 图 像 已 
可 得 到 较 好 的 分 割 效果 。 
彩色 图 像 常 用 R、G、B 三 分 量 的 值 来 表示 ， 但 R、G、B 三 分 量 之 间 常 有 很 高 的 相关 
性 ， 直 接 利 用 这 些 分 量 常常 不 能 得 到 所 需 的 效果 。 为 了 降低 彩色 特征 空间 中 各 个 特征 分 量 之 
间 的 相关 性 ， 以 及 为 了 使 所 选 的 特征 空间 更 方便 于 彩色 图 像 分 割 方法 的 具体 应 用 ， 实 际 中 常 
需要 将 RGB 图 像 变换 到 其 他 的 色彩 空间 中 去 。 
比较 接近 人 对 颜色 视觉 感知 的 是 色 度 、 饱 和 度 、 亮 度 〔(Hue、Saturation 、Intensity， 
HSI) 空间 。 其 中 ，I 表示 颜色 的 明暗 程度 ， 也 有 用 V (value) 表示 的 ， 主 要 受 光源 强 弱 影 
响 ，H 表示 不 同 颜色 ， 如 黄 、 红 、 绿 ， 而 S 表示 颜色 的 深浅 。 注 意 ，HSI 模型 有 两 个 重要 的 
事实 作为 基础 ， 首 先 ，I 分 量 与 彩色 信息 无 关 : 其 次 H 分 量 和 S 分 量 与 人 感受 彩色 的 方式 
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密 相连 。HSI 空间 比较 直观 并 且 符合 人 的 视觉 特性 ， 这 些 特 点 使 HSI 模型 非常 适合 基于 人 的 
视觉 系统 对 彩色 感知 特性 的 图 像 处 理 。 从 RGB 到 HSI 的 转换 关系 为 
再 = arccos((2R -G-B)/M2sqrt(R -G7+(R-B)G-B)7) 
B>G 
也 =2Pi- 孔 
S=1-3mnin(R,G,B)MR+G+B) 
I=(R+G+B)/3 
其 中 ，S 也 有 用 下 式 计算 的 : S = max(R,G,B)- min(R,G,B) 
另外 ， 和 孟 塞 尔 色彩 空 间 也 用 一 个 三 维 空间 的 模型 将 各 种 表面 色 的 三 种 视觉 特性 : 亮度 、 
色 度 、 饱 和 度 全 部 表示 出 来 。 孟 塞 尔 色 彩 空 间 的 颜色 样品 在 视觉 上 是 均匀 的 ， 因 而 可 以 用 它 
来 考察 和 验证 与 某 一 色差 公式 有 关 的 颜色 空间 的 均匀 性 。 备 塞 尔 色 彩 空间 的 色 度 值 、 亮 度 
值 、 彩 度 值 大 致 反映 了 物体 颜色 的 规律 ， 代 表 了 颜色 的 色 度 、 亮 度 和 饱和 度 的 主观 特性 ， 但 
和 孟 塞 尔 色 彩 空间 完全 以 主观 色 表 为 基础 ， 没 有 数学 表达 式 ， 使 用 起 来 很 不 方便 。 除 了 这 些 常 
用 的 色彩 系统 外 ， 还 有 如 YIQ、YUV、YCBCR 等 色彩 系统 。 


彩色 图 像 分 割 是 图 像 处 理 中 的 一 个 主要 问题 ， 也 是 计算 机 视觉 领域 低层 次 视觉 中 的 主要 
问题 。 

总 的 来 说 ， 彩 色 图 像 分 割 的 方法 可 以 分 为 基于 像 元 、 区 域 和 边缘 的 分 割 ， 前 两 类 利用 的 
是 相似 性 ， 基 于 边缘 的 分 割 利用 的 是 不 连续 性 。 

1. 基于 像 元 的 分 割 方法 

基于 像 元 的 分 割 方法 又 可 分 为 三 类 : 直方 图 门限 技术 、 色 彩 空 间 聚 类 法 以 及 模糊 聚 类 分 
割 方法 。 其 中 ， 直 方 图 门限 技术 是 最 常用 的 ， 由 于 图 像 门限 处 理 的 直观 性 和 易于 实现 的 性 
质 ， 使 它 在 彩色 图 像 分 割 应 用 中 处 于 中 心地 位 。 

(1) 直方 图 门限 技术 

Tominaga 提出 可 将 RGB 色彩 空间 转换 成 HVC 色彩 空间 或 其 他 色彩 空间 ， 如 HSI， 再 
分 别 求 H、V、C (或 H、S、D) 的 一 维 直方 图 ， 寻 找 最 明显 的 峰值 ， 一 般 是 选 定 两 个 作为 
门限 。Holla 将 RGB 色彩 空间 转换 成 RG、YB、I， 再 将 这 3 个 通道 用 带 通 滤波 器 平滑 ， 滤 
波 器 中 心 频率 过 滤 这 三 种 色彩 特征 的 比率 是 I:RG:YB=4:2:1， 然 后 在 二 维 直 方 图 RG-YB 
中 寻找 峰值 点 和 基点 ， 从 而 将 像素 点 分 成 两 个 区 域 。 但 是 该 方法 会 在 图 像 中 留 下 捕捉 不 到 
的 部 分 ， 因 此 可 以 再 考虑 将 其 他 的 特征 添 进去 ， 如 亮度 或 者 像素 的 局 部 相连 性 ， 这 样 可 以 
增强 分 割 效果 。Stein 的 方法 是 对 Holla 的 方法 的 改进 ， 算 法 中 加 入 了 领域 的 特征 。 当 留 下 
了 一 些 没有 被 分 配 到 的 像素 点 时 ， 就 取 它 周围 的 3x3 的 模板 ， 如 果 模板 中 有 一 个 或 者 多 个 
指派 到 区 域 A 中 ， 则 该 像素 点 也 被 指派 到 同样 的 区 域 A 中 去 。 如 果 该 领域 模板 中 
的 像 没 被 指派 到 任何 区 域 或 者 被 指派 到 了 不 同 的 区 域 中 ， 那 么 该 像素 点 仍然 不 被 指 
派 。 这 样 的 话 可 能 还 是 有 残留 点 ， 但 是 比率 要 少 得 多 。R.Ohtander 的 方法 是 比较 经 典 的 ， 
它 采 用 九 个 色彩 特征 ， R、G、B、H、S、V、Y、I、Q， 对 这 九 个 特征 分 别 计算 直方 图 ， 
再 选择 最 好 的 峰值 作为 门限 。Ohta 等 提出 的 方法 和 前 面 方法 的 不 同 点 在 于 它 将 RGB 色彩 























上 可 以 看 到 各 自 的 峰值 点 ， 该 算法 给 出 的 II、I2、13 的 表达 式 相当 于 动态 K-L 变换 的 结 
果 ， 而 且 都 是 对 R、G、B 的 线性 变换 ， 不 存在 奇异 点 ， 不 同 的 图 像 对 II、I2、13 各 自 的 
峰值 点 分 割 的 效果 有 差别 ， 需 要 自动 选取 合适 的 门限 。 根 据 II、I2、13 的 直方 图 ， 有 明显 
双 峰 的 更 适合 该 图 像 。 

(2) 色彩 空间 聚 类 法 

该 方法 结合 了 直方 图 阔 值 选取 技术 。 先 将 RGB 色彩 空间 转换 成 HLS 色彩 空间 (H、 
L、&S 的 表达 式 已 给 出 )， 根 据 I 的 值 将 图 像 分 为 过 亮 区 域 和 非 过 亮 区 域 ， 在 过 亮 区 域 里 以 H 
为 主要 特征 ， 根 据 直方 图 取 峰 值 进行 分 割 ， 在 非 过 亮 区 域 里 以 S 为 主要 特征 ， 根 据 直 方 图 取 
峰值 进行 分 割 ， 最 后 将 分 割 的 两 副 图 像 合 并 。Ferri 则 是 通过 神经 网 络 将 像素 分 成 几 个 区 域 ， 
再 利用 编辑 和 压缩 技术 来 减少 分 类 的 个 数 。 该 方法 用 的 是 YUV 色彩 空间 ， 它 把 每 个 像素 点 
公用 扩展 成 矢量 下 人 @ 旋 = 记 亿 六 FPCG+ 记 六 FG+ 有 六 UG- 用 六 FFGE 一 及 六 UG7+ 月 ， 
FG7+ 人 站,UG7 -站 FFG7 一 六; 。 其 中 , 六 是 期 望 分 割 的 目标 的 大 小 。Lauterbach 是 在 LUV 
色彩 空间 中 进行 分 割 的， 首先 求 二 维 UV 直方 图 的 最 高 点 ， 这 个 最 高 点 是 通过 计算 累计 直方 
图 的 值 和 一 个 领域 窗 的 均值 之 差 得 到 的 。 然 后 添加 色彩 匹配 线 (acl)， 这 条 线 是 通过 两 个 聚 
类 中 心 的 一 根 直线 。 像 素 值 在 UV 空间 的 那 两 个 聚 类 中 心 之 间 的 acl 的 欧 氏 距 离 决 定 了 像素 
点 被 分 派 到 哪 两 个 类 中 间 去 。 最 后 在 两 类 中 用 最 小 距离 准则 选择 一 类 。 但 是 ， 该 方法 没有 考 
虑 亮度 ， 所 以 在 某 些 情况 下 不 太 适 用 。 

(3) 模糊 聚 类 分 割 法 

模糊 聚 类 分 割 法 基于 阔 值 和 模糊 C- 均 值 聚 类 法 ， 先 粗糙 地 用 标量 空间 分 析 的 一 维 直方 
图 分 割 。 其 具体 步骤 是 : 计算 图 像 每 一 个 色彩 特征 的 直方 图 ， 标 量 分 析 直方 图 ， 定 义 合法 的 
几 个 类 到， 到，…， 扩 ;对 属于 类 别 太 (1 入 i 生 ec) 的 每 一 个 像素 点 P， 用 i 标 记 户 计算 每 
一 类 万 的 重心 ;对 没有 被 分 类 的 像素 值 ptx,y) ， 用 模糊 成 员 函 数 UV 计算 ， 取 最 大 的 U(x,y 
〈 此 时 类 别 为 大)， 则 将 该 像素 疡 点 分 派 到 及。 

2. 基于 区 域 的 分 割 方法 

由 于 彩色 图 像 分 割 的 目的 是 将 图 像 划 分 为 不 同 区 域 。 基 于 像素 的 分 割 是 通过 以 像素 性 质 
的 分 布 为 基础 的 阔 值 来 进行 的 ， 如 灰 度 级 的 值 或 颜色 ， 在 这 一 节 里 讨论 的 是 以 直接 找寻 区 域 
为 基础 的 分 割 方 法 ， 主 要 可 分 为 区 域 生长 和 区 域 分 离 与 合并 两 类 技术 。 

(1) 区 域 生长 

区 域 生长 是 一 种 根据 事前 定义 的 准则 将 像素 或 子 区 域 聚合 成 更 大 区 域 的 过 程 。 其 基本 的 
方法 是 以 一 组 种 子 点 开始 ， 将 与 种 子 性 质 相似 《〈 如 灰 度 级 或 颜色 的 特定 范围 ) 的 相 邻 像素 附 
加 到 生长 区 域 的 每 个 种 子 上 。 不 同 的 方法 ， 其 相似 性 准则 不 一 样 ， 该 准则 的 选择 不 仅 取决 于 
面 对 的 问题 ， 还 取决 于 有 效 图 像 数 据 的 类 型 。 一 些 基本 的 有 某 种 一 致 性 的 区 域 是 事先 给 定 
的 ， 然 后 用 不 同 的 方法 加 入 周围 的 领域 。 用 边界 松弛 法 分 割 : 给 定 一 个 阔 值 Daw， 如 果 平 均 
距离 D(R) < Da ， 则 区 域 R 是 一 致 的 〈 即 是 同一 类 )。 如 果 忆 属于 区 域 RR， 且 六 与 区 域 及 
相 邻 ， 并 且 将 从 区 域 R。 移 至 Rs 的 距离 减 去 D(Ro)+D(RI) 后 ， 还 可 以 满足 D(R) < Du ， 那 
么 就 将 已 从 区 域 R. 移 至 Ri。 用 2x2 的 块 ， 通 过 加 入 相 邻 的 像素 来 增长 区 域 ， 如 果 像 素 点 的 
颜色 值 与 矩 心 的 颜色 值 的 差 值 小 于 2Du。 ， 则 加 入 该 像素 。 除 此 之 外 ， 还 可 以 用 地 理 分 水 岭 
的 算法 来 分 割 图 像 ， 该 算法 要 求 事先 知道 种 子 点 的 相关 性 ;还 可 以 根据 一 些 统计 数据 来 进 
行 区 域 增 长 。 或 者 用 快速 混合 分 割 方法 : 由 六 边 形 领域 的 均值 代替 该 点 的 像素 值 ( 即 平滑 
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作用 )， 这 种 分 割 方法 是 基于 一 种 分 等 级 的 六 边 形 结构 组 织 ， 在 最 低层 的 时 候 ， 用 局 部 区 域 
增长 法 ， 这 样 可 以 获得 小 尺寸 的 相连 区 域 ， 再 上 一 层 的 时 候 ， 刚 刚 那 层 的 每 一 个 小 尺寸 的 
相连 区 域 被 看 为 是 一 个 像素 处 理 ， 同 样 再 取 六 边 形 均值 ， 再 进行 区 域 增长 ， 这 样 一 步 一 步 
进行 下 去 。 

(2) 区 域 分 离 与 合并 

前 面 讨论 的 区 域 生长 过 程 是 从 一 组 种 子 点 开始 的 ， 另 一 种 可 作为 替换 的 方法 是 在 开始 时 
将 图 像 分 割 为 一 系列 任意 不 相交 的 区 域 ， 然 后 将 它们 进行 聚合 或 拆 分 。 还 有 一 种 方法 是 先 将 
图 像 分 成 彩色 区 域 和 非 彩色 区 域 ， 然 后 用 直方 图 门限 法 ， 进 行 8x8 块 的 合并 ， 使 用 的 色彩 空 
间 是 HSI。 

3. 基于 边缘 的 分 割 方法 

边缘 检测 对 彩色 图 像 分 割 是 一 个 重要 的 工具 ， 其 分 割 方法 可 以 分 为 两 大 类 : 一 类 是 局 部 
边缘 检测 技术 ， 另 一 类 是 全 局 边缘 检测 技术 。 边 缘 检 测 技术 常用 到 Sobel、LOG 算 子 。 局 部 
边缘 检测 技术 只 需要 考虑 像素 点 领域 的 信息 来 决定 一 个 边缘 点 ， 常 用 模糊 C- 均 值 聚 类 法 。 全 
局 边缘 检测 技术 必须 考虑 到 全 局 最 优化 ， 一 般 来 说 ， 很 多 全 局 边缘 检测 技术 是 基于 马尔 可 夫 
随机 过 程 的 不 同 应 用 。 还 有 的 算法 是 先 用 Canny 算 子 检测 出 强度 边缘 ， 然 后 在 提取 出 来 的 所 
有 边缘 里 根据 色调 和 饱和 度 门限 逐步 消除 掉 一 些 边缘 。 

4 其 他 方法 

除了 上 述 3 类 彩色 图 像 分 割 方法 之 外 ， 还 有 一 些 彩色 分 割 的 综合 方法 ， 如 分 步 分 割 方 
法 : 第 一 步 借助 取 阔 值 方法 进行 粗略 分 割 将 图 像 转 化 为 若干 个 区 域 ， 第 二 步 利 用 模糊 C- 均 值 
聚 类 法 将 第 一 步 剩 下 的 像素 进一步 分 类 。 这 种 方法 可 看 做 是 由 粗 到 细 进 行 的 ， 先 用 阔 值 方法 
是 为 了 减少 运用 模糊 C- 均 值 聚 类 法 所 需 的 计算 量 。 

测量 空间 聚 类 法 是 分 割 彩 色 图 像 常 用 的 方法 ， 彩 色 图 像 在 各 个 空间 均 可 看 做 由 3 个 分 量 
构成 ， 所 以 分 割 彩 色 图 像 的 一 种 方法 是 娃 立 “个 3-D 直方 图 ， 它 可 用 一 个 3-D 数组 表示 。 这 
个 3-D 数组 中 的 每 个 元 素 代表 图 像 中 给 定 三 个 分 量 值 的 像素 的 个 数 。 阔 值 分 割 的 概念 可 以 扩 
展 为 在 3-D 空间 搜索 像素 的 聚 类 ， 并 根据 聚 类 来 分 割 图像 。 该 方法 的 优点 是 : 首先 ， 将 图 像 
由 图 像 空间 转换 到 测量 空间 的 变换 常 是 多 对 一 的 变换 ， 这 样 变换 后 数据 量 减 少 ， 易 于 计算 ; 
其 次 ， 尽 管 许多 聚 类 方法 本 质 上 是 递归 或 欠 代 的 ， 大 部 分 聚 类 方法 可 以 产生 比较 光滑 的 区 域 
边界 且 不 易于 受 噪 声 和 局 部 边缘 变化 的 影响 。 

马尔 可 夫 随 机 场 方法 也 可 用 于 多 分 辨 率 彩色 图 像 分 割 ， 这 是 一 种 收敛 于 最 大 后 验 概率 的 
松弛 方法 。 第 一 步 的 粗 分 割 使 用 尺度 空间 滤波 器 以 获得 聚 类 的 全 局 信息 ; 第 二 步 利 用 多 尺度 
马尔 可 夫 随 机 场 细 化 分 割 。 


习题 


8-1 什么 是 图 像 分 割 ? 常用 的 图 像 分 割 方法 可 以 分 为 哪 几 种 类 型 ? 

8-2 ”设计 一 个 程序 能 够 找 出 具有 双 巍 直方 图 特性 图 像 的 最 佳 分 割 阔 值 。 

8-3 应 用 MATLAB 语言 编写 实例 ， 对 Sobel、Prewitt、Roberts、LOG、Canny 方法 的 
边缘 检测 性 能 进行 比较 。 

8-4 常用 的 基于 梯度 的 边缘 检测 算 子 有 哪些 ? 它们 各 有 何 特点 ? 














8-5 边缘 检测 算 子 有 哪些 ? 它们 各 有 什么 优 缺 点 ? 请 编程 实现 它们 。 


8-6 LOG 算 子 的 基本 原理 是 什么 ? 它 具 有 哪些 优点 ? 
8-7 什么 是 Hough 变换 ? 试 述 采 用 Hough 变换 检测 直线 的 原理 ， 用 MATLAB 语言 编 





写 相应 的 程序 。 
8-8 应 用 MATLAB 语言 编写 对 一 幅 灰 度 图 像 进行 边缘 检测 、 二 值 化 的 程序 〈 检 测 和 二 
值 化 的 方法 可 以 根据 实际 图 像 进行 选择 )。 
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第 9 章 小 波 分 析 及 其 在 


MATLAB 中 的 应 用 


小 波 分 析 是 建立 在 泛 函 数 分 析 、Fourier 分 析 、 样 条 分 析 及 调和 分 析 基础 上 的 新 的 分 析 处 
理工 具 。 它 又 被 称 为 多 分 辨 率 分 析 ， 在 时 域 和 频 域 同 时 具有 良好 的 局 部 化 特性 ， 常 被 誉 为 信 
号 分 析 的 “数学 显微镜 ”。 近 十 多 年 来 ， 小 波 分 析 的 理论 和 方法 在 信号 处 理 、 语 言 分 析 、 模 
式 识 别 、 数 据 压 台 、 图 像 处 理 、 数字 水 印 、 量 子 物 理 等 专业 和 领域 得 到 了 广泛 的 应 用 。 

近 些 年 ， 小 波 分 析 被 泛 用 于 图 像 的 压缩 、 降 品 、 平 滑 和 融合 等 方面 ， 在 人 脸 识别 、 医 
学 图 像 处 理 、 机 器 人 视觉 、 数 字 电视 等 领域 受到 人 们 越 来 越 多 的 重视 。 基 于 二 维 小 波 分 析 进 
行 图 像 处 理 具 有 坚实 的 理论 基础 ，MATLAB 软件 在 小 波 工具 箱 中 也 提供 了 强大 的 图 像 处 理 
功能 ， 包 括 采用 命令 行 和 图 形 用 户 接口 等 。 


9.1 小 波 变 换 基础 
9.1.1 


小 波 是 通过 对 基本 小 波 进行 尺度 伸缩 和 位 移 得 到 的 。 基 本 小 波 是 一 个 具有 特殊 性 质 的 实 
值 函数 ， 其 震荡 快速 衰减 ， 且 在 数学 上 满足 积分 为 零 的 条 件 ， 即 
[vodu=o (9-1) 





其 频谱 满足 条 件 


G=[ 三 一 Ad el (9-2) 


和 
维 连 续 小 波 基 函 数 是 通过 尺度 因子 和 位 移 因子 由 基本 小 波 产 生 的 ， 即 


ws- 起 ws (9-3) 
一 维 连 续 小 波 变换 也 称 为 积分 小 波 变 换 ， 定 义 为 
及 CO=UwsG9= 全 7eysad= 天 万 7eovs[ 有 ja 2 


其 逆 变 换 为 
1 fo rm d 
Ja=e 太太 CowssC0d6 呈 (9-5) 





小 波 分 析 及 其 在 MATLAB 中 的 应 用 











- 维 连续 小 波 基 函 数 定义 为 
wasGo= 首 "全 斌 二 (9-6) 
- 维 连 续 小 波 变 换 是 电 
及 (app0)= 全 全 Top wan Go)ddy (9-7) 衣 
二 维 连续 小 波 逆 变 换 为 
Ac- 直方 户 记 eawaaeanaaan 才 ne 
1. 滤波 器 族 


这 里 将 小 波 变换 与 一 组 带 通 线性 〈 卷 积 ) 滤波 器 相 联系 ， 来 解释 小 波 变换 的 基本 原理 。 
首先 定义 尺度 ga 上 的 一 般 小 波 基 函 数 : 


全 (9-9) 
We) 志 v( 引 
这 是 用 a 作 为 尺度 因子 ， 并 用 az 规范 了 基本 小 波 。 若 记 其 翻转 共 斩 为 
友 ma= 志 y( 
= 
并 
交 O=wWa= 二 人 (-] 
小 波 变换 就 可 以 表示 成 滤波 器 族 : 
丙 (D= 全 Jo7O-Dd=y* 凡 (9-11) 
而 且 每 个 滤波 器 的 输出 分 量 再 次 滤波 并 适当 伸缩 后 组 合 在 一 起 可 重 构 F(x) : 


] ro pm 攻 da 
Ja 人 三 Verzoove-9 丈 


《9-10) 


这 5 〈9-12) 
人 CUVoryoa 守 


图 9-1 表示 了 对 一 个 信号 的 小 波 变 换 滤 波 器 族 的 分 析 。 
站 “上 一 一 帮 ( 
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图 9-1 对 一 个 信号 的 小 波 变换 滤波 器 族 的 分 析 


2. 二 维 滤波 器 族 
在 二 维 情况 下 ， 每 一 个 滤波 器 都 是 一 个 二 维 冲 激 响 应 ， 输 入 是 图 像 上 的 带 通 滤波 器 ， 滤 





波 后 的 图 像 的 登 层 组 成 了 小 波 变换 。 图 9-2 对 二 维 滤 波 器 族 进 行 了 说 明 。 
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图 9-2 ”二 维 滤波 器 族 示 意图 


回国 区] 
在 数值 计算 中 ， 和 需要 对 小 波 变换 的 尺度 因子 、 位 移 因子 进行 离散 化 ， 一 般 采 用 如 下 的 离 
散 化 方式 ; 
令 尺 度 因子 wa= of ，6= may 〈( 其 中 ，a>1，0z0，m， 7 为 整数 ) 
小 波 基 函 数 为 




















(9-13) 





必 sCD= 走 司 : 
适当 选择 凡 ，ao，bo 使 如 (xz) 构成 规范 正 交 基 。 
通常 采用 wm =2， 己 =1 构 成 离散 二 进 小 波 。 

例如 ， 在 平方 可 积 函 数 空间 已 (R) 中 ， 最 典型 的 规范 正 交 基 是 Haar 基 ， 取 mw =2， =1! 
时 ， 小 波 函 数 族 为 





ao- 记 夕 < (9-14) 
1. 多 分 辩 分 析 


基本 小 波 通过 伸缩 构成 一 组 基 函 数 ， 在 大 尺度 上 ， 膨 胀 的 基 函 数 搜索 大 的 特征 ;而 在 较 
小 的 尺度 上 ， 它 们 则 寻找 细节 信息 。 
(1) 金字 塔 算法 
对 于 数字 图 像 〈 以 512x512 为 例 )， 通 过 连续 平均 2x 2 的 像素 块 并 丢掉 隔行 隔 列 的 像 
素 ， 将 得 到 缩小 4 倍 的 图 像 (256x256 ， 行 列 各 缩小 2 倍 )。 这 样 迁 代 进行 ， 直 到 得 到 1x1 
的 图 像 为 止 。 如 果 利用 同样 尺寸 的 边缘 检测 算 子 〈 如 3x3 的 Sobel 算 子 )， 在 原始 图 像 上 则 
会 得 到 小 边缘 ， 在 256x 256 及 更 小 的 图 像 上 会 得 到 稍 大 及 更 大 的 边缘 。 
(2) 拉 普 拉 斯 金字 塔 编码 
对 原始 图 像 万 G 7)N x N,N = 2") 作 高 斯 滤波 ， 将 图 像 分 解 为 半分 辩 率 的 低频 分 量 和 整 分 
辩 率 的 高 频 分 量 。 
JPD=[ 万 xg]C22527) 
及 亿 旋 = 万 全 [万 xg]G 访 
这 一 过 程 是 在 间隔 抽样 后 的 图 像 上 人 迭代 进行 的 ， 经 过 兄 次 迭代 得 到 一 组 及 他 7 和 最 终 的 
低频 图 像 记 (六 〈 一 个 点 ) 组 成 一 个 编码 图 像 金 字 塔 。 图 像 的 解码 过 程 以 相反 的 次 序 进行 。 
从 最 后 一 幅 图 像 凡 (, 7 开始， 对 每 一 幅 抽样 图 像 央 ( 姓 都 进行 一 个 增 频 采样 ， 并 与 gb, 妃 卷 


(9-15) 
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积 进行 内 插 。 增 频 采 样 是 在 采样 点 之 间 插入 零 的 过 程 ， 所 得 结果 被 添加 到 下 一 幅 〈 前 一 幅 ) 
图 像 扩 -,(.7) 上 ， 再 对 所 得 图 像 重 复 执行 这 一 过 程 。 这 个 过 程 能 无 误差 地 重建 出 原始 图 像 。 
图 9-3 给 出 了 拉 普 拉 斯 金字 塔 编码 的 策略 图 。 
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(7 7 AD) 
图 9-3 ” 拉 普 拉 斯 金字 塔 编码 的 策略 图 

由 于 记忆 7 图像 在 很 大 程度 上 降低 了 相关 性 和 动态 范围 ， 因 此 可 以 使 用 较 粗 的 量化 等 
级 ， 因 而 可 以 实现 一 个 很 大 程度 的 图 像 压缩 。 

(3) 子 带 编码 和 解码 

对 于 有 限 带宽 信号 ， 若 将 其 分 解 为 窄带 分 量 ， 当 采用 双 通道 子 带 时 ， 对 应 带宽 划分 为 两 
个 分 量 〈 子 带 )， 如 低 半 带 和 高 半 带 ， 构 造 子 带 编码 ， 这 是 一 种 时 频 域 技术 。 低 半 带 滤波 器 
和 高 半 带 滤波 器 的 建立 如 图 9-4 所 示 。 
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图 9-4 低 半 带 滤波 器 和 高 半 带 滤波 器 的 建立 
直 理想 信号 的 频谱 _b) 理想 低 半 带 滤波 器 c) 理想 高 半 带 滤波 器 


双 通 道子 带 编码 和 解码 ， 具 有 如 下 形式 : 
Su(kvD= 》 (VDOm(ci+2K)VD) (9-16) 


gtyD= 》 HGVOn(ri+2K)VD (9-17) 








重建 形式 ， 
JivD = 2>[ go(EVDN((-i+26DVD+SI(EVODN(C-i+26vD] (9-18) 


图 9-5 给 出 了 双 通 道子 带 的 编码 和 解码 。 


SuiVD 

| AiGVD) -人 二 siivD 人 二 mlivD 
&i0V0 

| mcv 上 个 二 siGVD 修 ov 


图 9-5 双 通 道子 带 的 编码 和 解码 























JiGVD JiGVD 























2. 利用 双 通 道子 带 编码 迭代 ， 自 底 向 上 建立 小 波 变换 
进行 子 带 编码 后 ， 对 低 半 带 再 一 次 进行 子 带 编码 ， 得 到 一 个 











首先 按照 低 半 带 和 高 半 卉 
N/2 点 的 高 半 带 信号 和 对 应 于 区 间 [0,swv] 的 第 一 个 /4 区 域 和 第 二 个 14 区 域 的 两 个 N/4 点 的 





子 带 信号 。 然 后 ， 连 续 进行 上 述 过程 ， 每 一 步 都 保留 高 半 带 信号 并 进一步 编码 低 半 带 信号 ， 
直到 得 到 一 个 仅 有 一 个 点 的 低 半 带 信号 为 止 。 这 样 ， 小 波 变换 系数 就 是 这 个 低 半 带 点 再 加 上 
全 部 用 子 带 编码 的 信 号 ， 如 图 9-6 所 示 。 最 前 面 的 NM2 个 系数 来 自 于 F(s) 的 高 半 带 ， 
接 下 来 的 N/4 个 点 来 自 于 第 二 个 4 区 域 ， 依 次 类 推 。 


iv 
2 人 MavO AVI 一 人 一 
JiGiVD 


ee 


SICiVD Bai(4ivD Si&iVD) 
图 9-6 离散 小 波 变换 算法 


图 9-6 给 出 了 离散 小 波 变换 算法 的 处 理 流程 。 
上 述 算法 被 称 为 快速 小 波 变 换 〈Fast Wavelet Transform)， 也 因 其 形状 而 被 称 为 Mallat 的 
“ 鱼 骨 型 算法 ”。 其 逆 变 换算 法 的 处 理 流程 如 图 9-7 所 示 。 


个 二 MivD 呈 -人 (一 AVI | -人 一 SA 
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Si(8iVD Sa(4iVD 


SiVD 
图 9-7 ”离散 小 波 逆 变 换算 法 











3. 离散 小 波 变换 的 设计 
根据 上 面 介 绍 的 子 带 编码 重 构 公 式 ， 在 频 域 上 有 











F)= 对 iaeomo+da mc| 


=FG)PoG)PoCG)+FG)B 世 CO) (9-19) 
=FG) 玉 ( 丽 G+ 丽 (9) G) 
所 以 双 通 道子 带 编码 的 两 个 滤波 器 必须 满足 条 件 : 
巨 @+G@)=1，0 科 人 直 和 ww (9-20) 
假设 io(s) 是 小 波 变换 中 使 用 的 具有 平滑 边缘 的 低 通 滤波 传递 函数 ， 则 相应 的 鼠 (s) 需 
按 下 式 给 出 ; 


2(9)=1- 刀 (Cs) (9-21) 
可 见 ， 设 计 一 个 离散 小 波 变换 的 任务 就 是 精心 挑选 低 通 滤波 器 。 我 们 称 符合 这 一 条 件 的 
离散 低 通 滤波 器 脉冲 响应 为 (tb) 为 尺度 向 量 ， 由 它 产 生 一 个 有 关 的 函数 称 为 尺度 函数 。 尺 度 
向 量 和 尺度 函数 彼此 互相 确定 。 
例如 ， 由 尺度 向 量 为 (b) 到 尺度 函数 的 定义 如 下 : 
@O=》 力 (DO(27 一 月 (9-22) 
5 
即 它 可 以 通过 自身 半 尺 度 复制 后 的 加 权 和 来 构造 。 另 外 它 也 能 用 带 尺 度 的 矩形 脉冲 函数 
卷 积 和 (k) 利用 数值 计算 方法 得 到 ; 
oO=limzC9 


(9-23) 
用 OO = V2》 为 (DC2x 一 站 
1 状 <12 
iC9=T[oD=172 四 =12 (9-24) 
0 思 >12 


相反 ， 由 尺度 函数 开始 ， 在 它 满足 单位 平移 下 正 交 归 一 条 件 时， 尺度 向 量 的 计算 方法 
如 下 : 
(OU-mD,DUC- 站 )=5nn 
jx(D=212@0201- 有 了 = 0 天 =0 527 (9-25) 


及 (=( 人 (inie(D)》 
4. 二 维 离散 小 波 变换 
为 了 将 一 维 离散 小 波 变换 推广 到 二 维 ， 只 考虑 尺度 函数 是 可 分 离 的 情况 ， 即 
do=oCo0oO) (9-26) 
式 中 ，@(x) 是 一 维 尺度 函数 ， 其 相应 的 小 波 是 yw(x) 。 下 列 3 个 二 维基 本 小 波 是 建立 二 维 小 
波 变换 的 基础 


多 C 人 =@CODwO) Co 人 =@O)wCD0w CD=wCOwOD (9272 
它 构成 二 维 平 方 可 积 函数 空间 己 (R?) 的 正 交 归 一 基 : 
YinCc 切 =20W -2 一 2m 7 二 01=12.3，70m 都 为 整数 (9-28) 


(1) 正 变换 





从 一 幅 Nx N 的 图 像 rc,y) 开始 ， 其 中 上 标 指示 尺度 ， 并 且 N 是 2 的 宕 数 。 对 于 7 = 0 ， 

尺度 27 =2=1， 也 就 是 原始 图 像 的 尺度 。/ 值 的 每 一 次 增 大 都 使 尺度 加 倍 ， 而 使 分 辩 率 减 

半 。 在 变换 的 每 一 层次 ， 图 像 都 被 分 解 为 4 个 四 分 之 一 大 小 的 图 像 ， 它 们 都 是 由 原始 图 像 与 

个 小 波 基 图 像 的 内 积 后 ， 再 经 过 在 行 和 列 方向 进行 2 倍 的 间隔 抽样 而 生成 的 。 对 于 第 一 个 
层次 =1)， 可 写成 

户 (m 站 =(1CoD),DC-2m07 一 20) 

及 On 有 =(HGoDwiCc-2my-2m) 

尼 (mPD=(HCoDw2C-2my-27) 

尼 Oo 站 =(1CoDWCc-2my 一 27) 

后 续 的 层次 〈 户 1)， 依 次 类 推 ， 形 成 如 图 9-8 所 示 的 形式 。 


5 39 











吕 由 
图 9-8 二 维 离散 小 波 变换 
到 原始 图 像 b) 第 一 层 e) 第 二 层 d) 第 三 层 


若 将 内 积 改写 卷 积 形式 ， 则 有 
局 OnP=[ 及 Co)*@Cae-]m2m 
局 On 站 =[ 及 co)*yCe-]C2m2m 
记 On 站 =[ 凡 ComD*yCn- 人 ]2m2m 
户 ,On 四 =[ 及 CD*yCae- 及 ]C2m2m 
因为 尺度 函数 和 小 波 函 数 都 是 可 分 离 的 ， 所 以 每 个 卷 积 都 可 分 解 成 行 和 列 的 一 维 卷 
积 。 例 如 ， 在 第 一 层 ， 首 先 用 为 (-z) 和 广 (-z9) 分 别 与 图 像 f(x,y) 的 每 行 作 卷 积 并 丢弃 奇数 
列 〈 以 最 左 列 为 第 0 列 )。 接 着 这 个 (NWxN)/2 和 矩阵 的 每 列 再 和 为 (-o) 、 为 (2 作 卷 积 ， 丢 
弃 奇 数 行 〈 以 最 上 行为 第 0 行 )。 结 果 就 是 该 层 变 换 所 要 求 的 4 个 (W/2)x(N/2) 的 数组 ， 
如 图 9-9 所 示 。 
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图 9-9 DWT 图 像 分 解 步骤 


(2) 逆 变 换 

逆 变 换 与 上 述 过 程 相似 ， 在 每 一 层 ， 通 过 在 每 一 列 的 左边 插入 一 列 零 来 增 频 采 样 前 一 层 
的 4 个 矩阵 ， 接 着 用 多 (xz) 和 胜 (z) 来 卷 积 各 行 ， 再 成 对 地 把 这 几 个 (NW/2)x N 的 矩阵 加 起 
来 ， 然后 通过 在 每 行 上 面 插入 一 行 0 来 将 刚才 所 得 的 两 个 矩阵 的 增 频 采样 为 Vx N ， 再 用 
久 C90 和 及 (x) 与 这 两 个 矩阵 的 每 列 卷 积 。 这 两 个 矩阵 的 和 就 是 这 一 层 重建 的 结果 。 


图 9-10 给 出 了 逆 小 波 变换 图 像 重 建 的 过 程 。 
行 列 
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图 9-10 DWT 图 像 重建 步骤 





















































5. 双 正 交 小 波 变换 
使 用 两 个 不 同 的 小 波 基 ， 一 个 用 来 分 解 〈 分 析 )， 另 一 个 用 来 重建 〈 合 成 )， 构 成 彼此 对 
偶 的 双 正 交 的 小 波 基 ; 





人 je 友 = 《9-31) 
两 个 小 波 都 能 用 于 分 解 : 
cu=(1CDZaCO)du=(FCDCD)》 (9-32) 
而 重建 为 
J0D=》> cupiroD= 记 di (92337) 
7 3 


一 维 双 正 交 小 波 变换 通过 4 个 离散 滤波 器 实现 ， 需 要 选择 两 个 低 通 滤波 器 ， 即 尺度 向 
量 ， 使 它们 的 传递 函数 满足 
夯 (D)= 记 (0D)=1 且 BoGw)= 访 (Csvw)=0 (9-34) 


武 贾 由 吕 三 er 是 折 蚕 频率 。 





由 它们 产生 两 个 带 通 滤波 器 〈 小 波 向 量 ): 
为 (D)= (DG 下 





























区 鹤 (9-35) 
入 (= (为 (1 一休 
双 正 交 小 波 变换 的 一 个 分 解 步骤 和 一 个 重建 步骤 如 图 9-11 所 示 。 
业态 
于 《 5 次 
Lo 到 
图 9-11 双 正 交 小 波 变换 的 一 个 分 解 步骤 和 一 个 重建 步骤 
YOO=V2》 用 +DOCx- 仆 
0 (9-36) 
VCD=V2》 廊 (Oz+DO(Cx- 门 
正 变换 的 二 维基 本 小 波 为 
久 C0 力 =@OOVODU 人 =@O)wCDW CD 念 =wCOwO7D (3 
道 变换 的 二 维基 本 小 波 为 
男人 0 妨 =@007O7 大 Co 人 = 旦 007 大 Co 力 =ZCOZO) (9-38) 


二 维 双 正 交 小 波 变换 就 是 由 对 应 的 小 波 基 确 定 的 。 


进 小 波 变换 
通常 在 数值 计算 中 ， 采 用 离散 化 的 尺度 及 位 移 因 子 ， 当 取 二 进 伸缩 《以 2 作为 因子 伸 
缩 ) 和 二 进位 移 〈 每 次 移动 上 /27 ) 时 ， 就 形成 二 进 小 波 。 
正 交 小 波 定义 为 满足 下 列 条 件 的 小 波 : 
YiCD = 272w(20x 一 昌 ,-oo< 六 < too 放大 为 整数 (9-39) 
它们 构成 已 (R?z) 〈 二 维 平方 可 积 函数 空间 ) 中 的 正 交 归 一 基 。/ 决定 伸缩 ， 而 人 确定 平 
移 幅 度 。 





了 队 





正 交 性 条 件 为 
《人 (wx 0 =6inbwm (CKronecher 函数 ) (9-40) 
任何 F(xz) e 己 都 可 展开 为 
Jo) = 六 own (9-41) 
式 中 ， 变 换 系 数 为 ES 
cu =( 人 (HowGCD)=2002 恬 JCow(C27x- 昌 dx (9-42) 


式 〈9-42) 就 是 小 波 级 数 展开 公 式 。 
当 进 一 步 把 A(xz) 和 基本 小 波 限制 为 在 [0,.1] 区 间 外 为 零 的 函数 时 ， 上 述 正 交 小 波 函 数 族 
就 成 为 紧 致 二 进 小 波 函 数 族 ， 它 可 以 用 单一 的 索引 半 来 确定 ; 
刀 io)=272w(22x= 间 (9-43) 





式 中 , 7 和 大 是 半 的 如 下 函数 : 





1=21+kJ=01… 大 =01…,2 生 ， 即 /是 满足 2 入 对 的 最 大 整数 ， 而 上 = -27 。 而 
相应 的 逆 变 换 为 
ja= 六 oO (9-44) 
| 
式 中 ， 假 定 wo(x) =1， 变 换 系 数 为 
ci =(jCooCO)=202 三 x zx(25x 一 dx (9-45) 





WA 5 j (9-46) 
四 


a a 
Haar 基本 小 波 函 数 是 定义 在 区 间 [0,.1] 上 的 函数 ， 如 图 9-12 所 示 。 
图 9-13 给 出 了 两 个 小 波 WioCo 和 Wi(x) 。 




















李 G9D 
1 
1/2 1 定 
-1 
图 9-12 ”Haar 基本 小 波 函 数 图 9-13 小 波 ws(xz) 和 ns) 
该 基本 小 波 定义 的 换 称 为 Haar 小 波 变换 ， 是 常用 的 小 波 变换 中 最 简单 的 一 种 。 








[9.14| MATLAB 中 的 数 工具 箱 | 


在 MATLAB 7.0 中 有 专门 的 小 波 函数 工具 箱 ， 支 持 小 波 在 图 像 处 理 中 的 应 用 。 小 波 函 
数 工具 箱 中 的 一 维 、 二 维 小 波 应 用 函数 见 表 9-1 和 表 9-2。 


表 9-1 一 维 离散 小 波 函 数 












































函数 名 功能 
appcoef 提取 了 一 维 小 波 分 解 低频 系数 
detcoef 提取 
dwt 单 层 
dwtmode 离散 小 波 变换 扩展 模式 
idwt 单 层 一 维 道 离散 小 波 变换 
upcoef 维 小 波 分 解 的 直接 重 构 
upwiev 维 小 波 分 解 的 单 层 重 构 
wavedec 多 层 一 维 小 波 分 解 
waverec 多 层 一 维 小 波 重 构 
wenergy 维 小 波 分 解 能 量 函数 
wrcoef 维 小 波 分 解 系数 单 支 重 构 





外 














表 9-2 ”二 维 离散 小 波 函 数 




































































函数 名 功能 
dv 单 层 二 维 小 波 分 角 

dwtper2 单 层 二 维 离散 小 波 变换 

wavedec2 

idwt2 

idwper2 

waverec2 

upwiev2 维 小 波 分 解 的 单 层 重 构 

weoef2 维 小 波 分 解 系数 单 支 重 构 

upeoe 人 维 小 波 分 解 的 直接 重 构 

detcoef 提取 二 维 小 波 分 解 高 频 系数 
appcoe 人 2 提 权 二 维 小 波 分 解 低频 系数 
whresh 进行 软 阅 值 或 便 阅 值 处 理 
wheoeP 系数 阔 值 处 理 
ddenemp 程 中 的 默认 阔 值 
wdenemp 用 小 波 进行 信号 的 消 吧 和 压缩 





9.2 


前 面 已 经 详细 讲述 了 图 像 增 强 技术 ， 


小 波 分 析 在 图 像 增强 中 的 应 用 


它 是 图 像 处 理 中 最 基本 的 技术 之 


， 这 里 只 介绍 基 








于 多 层 方法 的 增强 技术 。 小 





换 将 一 


局 图 像 分 解 为 大 小 、 位 置 和 方向 均 不 相同 的 分 量 ， 在 


作 逆 变换 之 前 ， 可 根据 需要 对 不 同位 置 、 不 同方 向 上 的 某 些 分 量 改变 其 系数 的 大 小 ， 从 而 使 


得 某 些 感 兴趣 的 分 量 放 大 而 使 某 些 不 





需要 的 分 量 减 小 。 其 基本 框图 如 图 9-14 所 示 。 





下放 











原始 图 像 
二 小 波 分 解 





图 像 增强 


低频 分 解 系数 增强 
一 小 波 重 构 








图 9-14 








高 频 分 解 系数 衰减 











基于 小 波 变换 的 图 像 增强 基本 原理 


下 面 举 例 说 明 图 像 的 增强 。 程 序 代码 如 下 ， 执 行 结果 如 图 9-15 所 示 。 





图 9-15 


.258 


基于 小 波 的 图 像 增强 效果 
a) sinsin 图 像 b) 增强 ， 





析 及 其 在 MATLAB 中 昌 





% 小 波 图 像 增 强 ， 对 于 图 像 ， 轮 廓 主要 在 低频 ， 细 节 在 高 频 
%% 对 低频 增强 ， 对 高 频 衰 减 处 理 

clear all 

load sinsin; 


subplot(1,2,1):image(X); 电 
colormap(map); 
%% 对 图 像 X 用 小 波 dbs 进行 2 层 分 解 


[cj=wavedec2(X,2,dbs); 
Csize=size(c); 
% 弱 化 不 重要 的 分 解 系数 
fori =1:Csize(2) 
这 c(iD)>100) 
ci)=2*c(i); 
else 
ciD)=0.5*c(D; 
end 
end 
% 重 构图 像 并 显示 
X=waverec2(c,lvdbs)); 
subplot(1,2,2)image(X); 
colormap(map); 


分 解 后 的 图 像 ， 其 主要 信息 〈 即 轮廓 ) 由 低频 部 分 来 表征 ， 而 其 细节 部 分 则 由 高 频 部 分 
表征 。 因 此 ， 在 上 述 举例 中 ， 对 分 解 后 的 低频 系数 加 权 进 行 增强 ， 而 对 高 频 部 分 加 权 进 行 减 
弱 ， 经 过 处 理 后 ， 即 达到 了 增强 图 像 的 目的 。 


9.3 ”基于 小 波 的 图 像 降 噪 和 压缩 


数字 图 像 在 产生 过 程 中 会 受到 诸如 传感器 振荡 ， 电 子 器 件 干扰 等 原因 的 影响 ， 导 致 转换 
后 得 到 的 数字 图 像 质 量 下 降 ， 影 响 了 对 图 像 内 容 的 理解 。 为 了 保证 后 续 处 理 的 正确 性 ， 需 要 
对 图 像 进行 去 噪 处 理 。 然 而 在 图 像 去 噪 时 ， 存 在 着 一 个 如 何 兼 顾 降低 噪声 和 保留 细节 的 难 
题 。 长 期 以 来 ， 人 们 根据 图 像 的 特点 、 噪 声 的 统计 特征 和 频谱 分 布 的 规律 ， 提 出 了 多 种 去 品 
方法 ， 如 维 纳 滤波 等 ， 但 是 降 噪 效果 往往 不 够 理想 。 

小 波 变换 具有 低 业 性 、 多 分 辨 率 、 去 相关 性 、 选 基 灵 活性 等 特点 ， 可 同时 进行 时 域 、 频 
域 的 局 部 分 析 ， 能 够 灵活 地 对 信号 局 部 奇异 特征 进行 提取 。 从 信号 学 的 角度 看 ， 小 波 去 噪 是 
一 个 信号 滤波 问题 ， 小 波 去 品 具 有 特征 提取 和 低 通 滤波 的 综合 功能 。 目 前 ， 基 于 小 波 分 析 的 
图 像 去 噪 技术 已 成 为 图 像 去 噪 的 一 个 重要 方法 。 

MATLAB 小 波 工具 箱 为 图 像 降 噪 和 压缩 提供 了 有 力 的 函数 支持 ， 见 表 9-3。 从 本 质 
上 看 ， 降 噪 和 压缩 的 原理 是 基本 类 似 的 ， 都 是 对 小 波 分 解 的 系数 进行 阅 值 处 理 ， 然 后 进 
行 重 构 。 
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MATLAB 





表 9-3 基于 小 波 的 图 像 降 噪 和 压缩 函数 


























函数 名 称 说 明 
wnoise 产生 小 波 的 噪声 测试 数据 
ddencmp 获取 降 噪 或 压缩 的 默认 值 
wthresh 执行 软 阔 值 或 硬 阔 值 
thselect 选择 降 噪 时 的 阔 值 
wbmpen 设 辕 一 维 或 二 维 信号 降 噪 的 阔 值 
wdcbm2 以 Birge-Massart 策略 设置 二 维 小 波 降 唆 或 压缩 的 阅 值 
wthcoe 人 2 - 维 小 波 系数 阔 值 处 理 
wdencmp 用 小 波 进行 一 维 或 二 维 信号 的 降 喉 或 压缩 





withrmngr 阔 值 设置 管理 
另外 ， 也 可 以 利用 小 波 包 的 一 些 函数 进行 压缩 和 降 噪 ， 见 表 9-4。 


表 9-4 小 波 包 降 噪 和 压缩 函数 

















函数 名 称 说 明 
ddenemp 获取 降 唤 或 压缩 的 默认 值 

wpbmpen 小 波 包 降 品 的 Penalized 阔 值 

wptheoef 小 波 包 系数 阅 值 处 理 

wpdenemp 使 用 小 波 包 进 行 降 品 和 压缩 

whrmner 闭 值 设置 管理 











这 里 主要 介绍 一 下 其 中 降 噪 和 压缩 的 核心 函数 : wdencmp() 函 数 ， 其 他 就 不 再 详细 介绍 
了 。 读 者 可 以 参考 一 下 工具 箱 的 函数 说 明 。wdencmp( 函 数 的 用 法 有 3 种 : 

@_[XC,CXC,LXC,PERF0,PERFL2]= wdencmp(gbl,X,'wnamevNTHR,SORH,KEEPAPP) 

@_[XC,CXC,LXC,PERF0,PERFL2]= wdencmp(lvd,X,'wname,N,THR,SORH) 

@ [XC,CXC,LXC,PERF0,PERFL2]= wdencmp(lvd,C,L,'wname',N,THR,SORHJ) 

函数 中 参数 的 含义 见 表 9-5。 


表 9-5 wdencmp() 函 数 中 参数 的 含义 





























参数 名 称 玫 - 区 
[CXCLXC] 附加 的 输出 变量 ， 是 XC 的 小 波 分 解 结构 
PERF0 PERFL 恢复 和 压缩 的 L2 范 数 百分比 
wname 小 波 函 数 名 
N 小 波 分 解 的 层 数 
SORH 取 值 为 或 者 hy， 表示 软 阅 值 或 硬 阔 值 
[CU 小 波 分 解 结构 
THR 3xN 和 撼 阵 ， 包 含 各 尺度 中 水 平 、 垂 直 和 对 角 3 个 方向 的 阔 值 














: 缩 就 是 去 掉 各 种 见 余 ， 保 留 重要 的 信息 。 图 像 压 缩 的 过 程 常 称 为 编码 ， 而 图 
像 的 恢复 则 称 为 解码 。 图 像 数据 之 所 以 能 够 进行 压缩 ， 其 数学 机 理 主要 有 下 面 两 点 。 

1) 原始 图 像 数据 往往 存在 各 种 信息 的 吕 余 如 空间 完 余 、 视 觉 元 余 和 结构 宛 余 等 )， 数 
据 之 间 存 在 相关 性 ， 邻 近 像素 的 灰 度 〈 将 其 看 成 随机 变量 ) 往往 是 高 度 相 关 的 。 

2) 在 多 媒体 应 用 领域 中 ， 人 眼 作为 图 像 信 息 的 接收 端 ， 其 视觉 对 边缘 的 急剧 变化 敏 
感 ， 以 及 人 眼 存在 对 图 像 的 亮度 信息 敏感 ， 而 对 颜色 分 辨 率 弱 等 ， 因 此 在 高 压缩 比 的 情况 
下 ， 解 压缩 后 的 图 像 信 号 仍 有 满意 的 主观 质量 。 

虽然 图 像 的 数据 是 非常 巨大 的 ， 但 是 可 以 采用 适当 的 坐标 变换 去 除 相关 ， 从 而 达到 压缩 
数据 的 目的 。 传 统 的 K-L 变换 就 是 以 这 种 思想 为 基础 的 ， 它 把 信号 的 一 小 块 看 成 是 一 个 独立 
的 随机 向 量 ， 它 的 基 函 数 由 余弦 函数 组 成 。 

小 波 变换 通过 多 分 辩 分 析 过 程 将 一 幅 图 像 分 成 近似 和 细节 两 部 分 ， 细 节 对 应 的 是 小 尺度 
的 瞬 变 ， 它 在 本 尺度 内 很 稳定 。 因 此 将 细节 存储 起 来 ， 对 近似 部 分 在 下 一 个 尺度 上 进行 分 
解 ， 重 复 该 过 程 即 可 ， 如 图 9-16 所 示 。 近 似 与 细节 在 正 交 镜像 滤波 器 算法 中 分 别 对 应 于 高 
通 滤波 和 低 通 滤波 ， 这 种 变换 通过 尺度 去 掉 相 关 性 ， 在 视频 压缩 中 被 证 明 是 有 效 的 。 
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图 9-16 小 波 变换 的 图 像 压缩 过 程 


上 述 方法 有 一 个 优点 : 即 图 像 分 成 多 个 细节 层 ， 因 此 应 用 时 可 以 先 给 出 一 幅 较 为 粗糙 的 
图 像 ， 然 后 可 根据 需要 提供 更 好 的 细节 。 

应 用 MATLAB 小 波 工具 箱 进行 图 像 压缩 ， 有 两 种 方法 。 

1) 利用 dwt20 函 数 对 图 像 进行 小 波 分 解 ， 再 用 upcoe 人 0 函数 对 分 解 后 的 图 像 进行 重 
构 ， 最 后 用 wcodematO 函 数 进行 量化 编码 。 程 序 代码 如 下 ; 





I=imread(eighttif) 
figure(l),imshow(D; 
%9%6% 进 行 系数 分 解 
[cachcv'cdj=dwt2(L'sym47; 
%9%% 进 行 图 像 重 构 
cod_fa=upcoef2(avcavdbl,1); 
cod_fh=upcoefP2Chchvdbl,1); 
cod_fv=upcoefP(v,ev'dbl,D; 
cod_ 包 =upcoef2(d,edvdblv1); 
%%% 编 码 显 示 图 像 
figure(2),imshow(wcodemattcod fa,255),[]); 
figure(3),imshow(wcodemattcod_fh,255),[]); 





让 














figure(4),imshow(wcodemattcod 1 





figure(5)imshow(wcodemat(cod 


执行 程序 代码 后 效果 如 图 9-17 和 图 9-18 所 示 。 





图 9-17 ”原始 图 像 





图 9-18 小波 分 解 


al 近似 值 b) 水 平 细节 系数 c) 垂直 细节 系数 d) 对 角 细节 系数 





小 波 变换 将 图 像 的 像素 解 相关 的 变换 系数 进行 编码 ， 比 对 原 像素 本 身 编 码 的 效率 更 高 。 
如 果 变 换 的 基 函 数 〈 此 时 为 小 波 函数 ) 将 大 多 数 重要 的 可 视 者 到 少量 的 系数 中 ，( 见 
图 9-18a)， 则 剩 下 的 系数 〈 见 图 9-18b 一 d) 可 以 被 粗略 地 量化 或 截取 为 0， 而 图 像 几 乎 没有 
失真 〈 比 较 图 9-17 与 图 9-18a)。 

2) 利用 小 波 工具 箱 中 专用 的 闪 值 压缩 图 像 函 数 wdencmpO。 
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下 面 通过 举例 来 说 明 这 两 种 方法 的 应 用 及 特点 。 
” 如 下 是 利用 wavedec2() 函 数 对 图 像 进行 小 波 分 解 后 ， 再 用 appcoeP20) 函 数 对 分 解 后 图 像 
进行 重 构 ， 最 后 用 wcodemat(O 函 数 进行 量化 编码 ， 程 序 代码 如 下 : 


load belmont2 人 
subplot(2,.2,1); 


image(X);colormap(map);axis square; 
whos(CX 7); 

% 对 图 像 进行 7 层 小 波 分 解 

[cj=wavedec2(CX,2,bior3. 
% 提 取 小 波 分 解 结构 中 的 
cA1=appcoef2(c,lvbior3.7.1); 
% 水 平方 向 
cHI=detcoeP(hc,LT); 

% 和 斜 线 方向 
cDI=detcoef2(d ,cl1); 

% 垂 直方 向 
eVI=detcoef2Cv,cTD); 

% 重 构 第 一 层 系 数 
Al1=wrcoeP(atc,lvbior3.7.1); 

HI=wrcoefP(h',c,lvbior3.7,1); 

D1=wrcoefP(d,c,l'bior3.7.1); 

V1=wrcoefP(Cv,c,lbior3.7.1); 

cl=[ALHIVLD1]; 
% 显 示 第 一 层 频率 信息 
subplot(2,2,2);image(c1); 

% 对 图 像 进行 压缩: 保留 第 一 层 低频 信息 并 对 其 进行 量化 编码 

cal=wcodemat(cA1,440,mat,0); 

% 改 变 图 像 高 度 并 显示 

cal=0.5scal; 

subplot(2,2,3);image(cal);colormap(tmap); 

whos(cal)) 

cA2=appcoef2(c,lvbior3.7.2); 

ca2=wcodemat(cA2,440,mat,0); 








层 的 低频 系数 和 高 频 系数 


ca2=0.5*ca2; 
Subplot(2,2,4);image(ca2),colormap(map); 
whos(ca27) 
结果 如 下 : 
压缩 前 图 像 的 大 小 为 
Name Size Bytes “Class 
X 240X320 614400 double array 


Grand total is 76800 elements using 614400 bytes 


第 一 次 压缩 后 图 像 的 大 小 为 











Name Size Bytes Class 
cal 127X167 169672 double array 
Grand total is 21209 elements using 169672 bytes 


第 二 次 压缩 后 图 像 的 大 小 为 


Name Size Bytes Class 
ca2 71X91 51688 double array 


Grand total is 6461 elements using 51688 bytes 


压缩 后 图 像 如 图 9-19 所 示 。 





图 9-19 小 波 的 图 像 






图 像 b) 分 解 后 的 低频 信息 和 高 频 信息 ec) 第 一 次 压缩 后 的 图 像 ”dj 第 二 次 压缩 后 的 图 像 


在 这 里 可 以 看 出 ， 第 一 次 压缩 提取 原始 图 像 中 小 波 分 解 第 人 此 时 
果 较 好 ， 压 缩 比较 小 〈 约 为 4 大 小 )。 第 二 次 压缩 是 提取 层 分 解 低频 部 分 的 低频 部 分 
〈 即 第 二 层 的 低频 部 分 )， 其 压缩 比较 大 〈 约 为 12)， 压 缩 在 视觉 上 也 基本 过 得 去 。 随 
着 分 解 层 数 的 增强 ， 压 缩 比 是 递减 的 。 

保留 原始 图 像 中 低频 信息 的 有 法 只 是 一 种 最 简单 的 压 。 它 不 需 经 过 其 他 处 理 
即 可 获得 较 好 的 压 同 当然 ， 对 于 上 面 的 例子 还 可 以 只 提取 小 波 分 解 的 第 三 、 第 四 层 的 
页 信 从 理论 上 i 缩 比 的 压缩 图 像 。 只 不 过 在 对 压 : 缩 比 和 图 像 质量 都 
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引 原始 
























缩 处 理 。 程 序 代码 如 下 : 















分 析 及 其 在 MATLAB 中 的 应 用 











load belmont2; 
subplot(2,.2,1); 
image(X):colormap(map); 


% 首 先 利 用 db3 小 波 对 图 像 X 进行 2 层 分 解 
[cj=wavedec2(X,2,db37; 人 
% 侈 局 阔 值 

[thr'sorhkeepapp]=ddencmpCcmpywv,XD); 

% 压 缩 处 理 :对 所 有 高 频 系数 进行 同样 的 阔 值 量化 处 理 

[Xecmp,cxc,lxcperf0,perfl2]=wdencmp(gbl,c,l db3,2,thr'sorh,keepapp); 

% 将 压缩 后 的 图 像 与 原始 图 像 相 比较 

subplot(2,2,2); 

image(Xcmp);colormap(map); 

% 显 示 相 关 参 数 

disp( 小 波 分 解 系数 中 为 0 的 系数 个 数 百分比 :7; 

perf0 

disp( 压 缩 后 保留 能 量 百分比 2》; 

perfl2 





首先 给 出 应 用 函数 wdencmpO 进 行 压缩 的 效率 ， 即 分 解 系数 中 置 0 的 系数 个 数 百分比 和 
保留 能 量 百 分 比 。 压 缩 图 像 如 图 9-20 所 示 。 





图 9-20 图 像 压缩 结果 
原始 图 像 b 压缩 后 的 图 像 


结果 如 下 : 


小 波 分 解 系数 中 为 0 的 系数 个 数 百 分 比 : 
perf0 = 
40.1967 


压缩 后 保留 能 量 百分比 : 


perfl2 = 
99.9616 
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根据 对 小 波 系数 处 理 方式 的 不 同 ， 常 见 的 去 噪 方法 可 分 为 三 类 : 基于 小 波 变换 模 极 大 值 








去 噪 ， 基 于 相 邻 尺度 小 波 系数 相关 性 去 噪 ; 基于 小 波 变换 域 阅 值 去 噪 。 其 中 小 波 阔 值 去 噪 方 
法 是 一 种 实现 简单 且 效 果 较 好 的 消 噪 方法 ， 应 用 最 为 广泛 。 

小 波 阀 值 消 噪 的 基本 思想 就 是 对 小 波 分 解 后 的 各 层 系数 模 大 于 和 小 于 某 阔 值 的 系数 分 别 
进行 处 理 ， 然 后 利用 处 理 后 的 小 波 系数 重 构 出 消 噪 后 的 图 像 。 在 阔 值 消 噪 中 ， 阔 值 函数 体现 
了 对 小 波 分 解 系数 的 不 同 处 理 策略 及 不 同 估计 方法 ， 常 用 的 阔 值 函数 有 硬 阔 值 函数 和 软 阔 值 
函数 。 硬 阔 值 函数 可 以 很 好 地 保留 图 像 边 缘 等 局 部 特征 ， 但 图 像 会 出 现 伪 吉 布 斯 效应 等 视觉 
失真 现象 ， 而 软 阔 值 处 理 相对 较 平滑 ， 但 可 能 会 造成 边缘 模糊 等 失真 现象 ， 为 此 人 们 又 提出 
了 半 软 闪 值 函数 。 

小 波 阔 值 消 噪 方法 处 理 阔 值 的 选取 ， 另 一 个 关键 因素 是 阔 值 的 具体 估计 。 如 果 阔 值 太 
小 ， 消 噪 后 的 图 像 仍然 存在 噪声 ， 相 反 如 果 阔 值 太 大 ， 重 要 图 像 特 征 又 将 被 滤 掉 ， 引 起 偏 
差 。 从 直观 上 讲 ， 对 于 给 定 的 小 波 系数 ， 噪 声 越 大 ， 阔 值 越 大 。 

图 像 信号 的 小 波 降 噪 步骤 有 三 步 ， 和 一 维 信号 的 降 噪 步骤 完全 相同 ， 所 不 同 的 是 ， 处 
理工 具 是 用 二 维 小 波 分 析 工 具 代替 了 一 维 小 波 分 析 工具 。 因 此 ， 对 二 维 图 像 信 号 的 降 品 方 
法 也 同样 适合 于 一 维 信号 ， 尤 其 对 几何 图 形 更 为 适合 。 二 维 小 波 分 析 用 于 图 像 降 噪 的 步骤 
如 下 : 

1) 二 维 图像 信 号 的 小 波 分 解 。 在 这 一 步 ， 应 当选 择 合适 的 小 波 和 恰当 的 分 解 层次 〈 记 
为 W)， 然 后 对 待 分 析 的 二 维 图 像 信号 进行 N 层 分 解 计算 。 

2) 对 分 解 后 的 高 频 系 数 进行 阔 值 量化 。 对 于 分 解 的 每 一 层 ， 选 择 一 个 恰当 的 阔 值 ， 并 
对 该 层 高 频 系数 进行 软 阔 值 量化 处 理 。 在 此 ， 阔 值 选 取 规 则 同 前 面 的 信号 处 理 部 分 。 

3) 二 维 小 波 的 重 构图 像 信 号 。 同 样 地， 根据 小 波 分 解 后 的 第 N 层 近似 〈 低 频 系 数 ) 和 
经 过 阔 值 量化 处 理 后 的 各 层 细节 【高 频 系 数 )， 来 计算 二 维 信号 的 小 波 重 构 。 

下 面 通过 具体 的 举例 来 说 明 利用 小 波 分 析 进 行 图 像 降 噪 这 个 问题 。 

程序 代码 如 下 : 


% 当 前 延 拓 模式 是 补 零 

% 载 入 原始 图 像 

load sinsin 

%X 包含 原始 图 像 

figure; 

image(X)colormap(tmap); 

% 产 生 噪声 图 像 
init=2055615866:randn(seed'init); 
x=X+18*randn(size(X)); 

figure; 




















image(x),colormap(map); 
% 使 用 wdencmp(O) 函 数 进行 图 像 降 品 

%% 寻 找 默 认 值 
[thrsorh.keepapp]=ddencmp(denvwv',x; 

% 使 用 全 局 闪 值 进行 图 像 降 品 
xd=wdencmp(gblvxvsym4',2,thrisorh.keepapp); 
figure; 

image(xd)colormaptmap); 








结果 如 图 9-21 所 示 。 可 以 看 出 ， 经 过 小 波 降 噪 后 的 图 像 非常 清楚 ， 达 到 了 很 好 的 平滑 
效果 。 





图 9-21 小 波 的 图 像 降 噪 应 用 


al 原始 图 像 b) 唆 声 图 像 c) 降 品 后 的 图 像 


9.4 小 波 的 融合 技术 


图 像 融 合 是 将 同一 对 象 的 两 个 或 更 多 的 图 像 合成 为 一 幅 图 像 ， 以 便 它 比 原来 的 任何 一 幅 
图 像 更 容易 被 人 们 理解 。 这 一 技术 可 应 用 于 多 频谱 图 像 理 解 及 医学 图 像 处 理 等 领域 ， 在 这 些 
场合 ， 同 一 物体 部 件 的 图 像 往往 是 采用 不 同 的 成 像 机 理 得 到 的 。 
图 像 融合 是 信息 融合 的 一 个 重要 分 支 ， 广 泛 地 用 于 目 
学 图 像 处 理 等 领域 。 人 全 主要 是 在 时 间 域 通过 算术 运算 实现 山 侣 ， 具有 算 
单 直观 ， 融 合 速度 快 ， 适 合 实 时 处 理 ， 但 其 没有 对 频率 变化 进行 考虑 。 
多 分 辨 2 了 图 像 的 融合 。 根据 分 解 形 式 的 不 同 ， 多 分 辨 率 
图 像 融 合算 法 又 可 分 为 多 分 辨 金字塔 方法 和 小 波 变换 方法 。 近 年 来 ， 基 于 小 波 变换 的 图 像 融 
合 越 来 越 受 到 重视 。 由 于 人 的 视网膜 图 像 是 在 不 同 频带 上 分 别 以 不 同 算 子 进行 融合 ， 而 基于 
小 波 分 解 的 图 像 融 全 也 是 以 同样 方式 进行 的 ， 所 以 ， 其 可 以 获得 与 人 的 视觉 特性 更 为 接近 的 
融合 效果 。 可 以 认为 ， 基 于 小 波 变换 的 图 像 融 合 应 该 是 很 有 前 途 的 研究 方向 。 
以 下 简单 介绍 一 下 小 波 变换 图 像 融 合 0 
如 果 一 个 图 像 进行 民 层 小 波 分 解 ， 得 到 〈3L+1) 层 子 带 ， 其 中 包括 低频 的 基带 C; 和 
35 层 的 高 频 子 带 太 、D 和 D?。 用 , 0 原始 图 像 ， 记 为 Cu ， 设 尺度 系数 @(z) 和 小 
波 系数 w(x) 对 应 的 滤波 器 系数 矩阵 分 别 为 妃 和 CG， 则 二 维 小 波 分 解 算 法 可 描述 为 
二 
二 Er 
Du = 瑟 CiG7 
DCGC iGr 
式 中 , 7 表示 分 解 层 数 ，A、 d 分 别 表示 水 平 、 垂 直 、 对 角 分 量 ， 妞 和 GT 分 别 是 刀 和 C 


的 共 罗 转 置 矩 阵 。 








法 简 














《9-47) 





小 波 重 构 算法 为 为 
Ci =TC 于 +GTID' 末 +TIDIG+GTDIG (9-48) 
基于 二 维 DWT 的 融合 过 程 如 图 9-22 所 示 ，ImageA 和 ImageB 代表 两 幅 原始 图 像 A 和 
B，ImageF 代表 融合 后 的 图 像 ， 具 体 步 骤 如 下 : 


ImageA 








融合 算 子 








融合 规则 




















配 准 的 原始 图 像 小 波 分 解 系数 
图 9-22 ”基于 二 维 DWT 的 图 像 融 合 过 程 


1) 图 像 的 预 处 理 。 

图 像 滤 波 ， 对 失真 变质 的 图 像 直 接 进 行 融合 ， 必 然 导致 图 像 噪声 融入 融合 效果 ， 所 以 在 
进行 融合 前 ， 必 须 对 原始 图 像 进行 预 处 理 以 消除 

图 像 配 准 : 多 种 成 像 模式 或 多 焦距 提供 
模式 和 多 焦距 以 提供 更 全 面 的 信和 4 
达到 几何 位 置 的 完全 对 应 。 

2) 对 ImageA 和 ImageB 进行 二 维 DWT 分 解 ， 得 到 图 像 的 低频 分 量 和 高 频 分 量 。 

3) 根据 低频 分 量 和 高 频 分 量 的 特点 ， 按 照 各 自 的 融合 算法 进行 融合 。 

4) 对 以 上 得 到 的 高 、 低 频 分 量 ， 经 过 小 波 逆 变 换 重 构 得 到 融合 图 像 ImageF 。 

以 下 为 用 小 波 分 析 对 两 个 不 同 的 图 像 进行 融合 的 应 用 举例 程序 代码 。 


load bust % 载 入 原始 图 像 1 
XIl=X; 
mapl=mapy; 
% 夯 出 woman 图 像 
subplot(2.2,1); 
image(X1);colormap(tmap); 
axis square 
% 载 入 原始 图 像 2 
load mask 
X2=X; 
map2=map; 
fori=1:256 
forj=1:256 
这 X2Gij)>100) 
X2Gij)=1.2*X2(ij); 
else 


声 。 
息 常常 具有 互补 性 ， 为 了 综合 使 用 多 种 成 像 
需要 将 有 效 信息 进行 整合 ， 使 多 幅 图 像 在 空间 域 中 














ET 





X2(ij)=0.5*X2Gij); 
end 
end 
end 


% 画 出 wbarb 图 像 全 
subplot(2.2.2); 
image(X2);colormap(tmap2); 


axis square 
[clLsl]=wavedec2CXL2,sym49; 
sizecl=sizec1); 
fori=l:sizec1(2) 
cl(D)=12+c10i); 
end 
[ec2,s2]=wavedec2(X2,2,sym47; 
c=cl+e2; 





subplot(2,2,3):;image(xx; 
axis square 


两 个 原始 图 像 及 其 融合 的 结果 如 图 9-23 所 示 。 





本 日 
图 9-23 小 波 的 图 像 融 全 效果 
引 原始 图 像 1 b) 原始 图 像 2 e) 融合 后 的 图 像 
一 幅 图 像 和 它 某 一 部 分 放大 后 的 图 像 融 合 ， 融 合 后 的 图 像 给 人 一 种 胖 瞳 肛 胱 梦幻 般 的 感 
觉 ， 对 较 深 的 背景 部 分 则 做 了 淡化 处 理 。 
下 面 为 利用 图 像 融合 方法 从 模糊 图 像 中 恢复 图 像 的 MATLAB 程序 代码 。 


% 载 入 第 一 幅 模糊 图 像 
load cathe 1; 

XI=X; 

% 载 入 第 二 幅 模糊 图 像 





FMATLABS 和 RE 








load cathe 2; 
X2=X; 
% 基 于 小 波 分 解 的 图 像 融合 
XFUS=wfusimg(X1,X2,.sym4,5,maxvmaxy; 
% 显 示 





colormap(map); 
subplot(2,2,1);image(X1); 
axis square; 
subplot(2.2,2);image(X2); 





axis squal 
subplot(2,2.3):image(XFUS); 
axis square; 


执行 程序 代码 ， 结 果 如 图 9-24 所 示 。 








图 9-24 ”图像 融 合 恢复 图 像 


a 原始 图 像 1 b) 原始 图 像 2 c) 融合 图 像 


9.5 小波 包 在 图 像 边 缘 检 测 中 的 应 用 


小 波 包 分 解 后 得 到 的 图 像 序列 由 近似 部 分 和 细节 部 分 组 成 ， 近 似 部 分 是 原始 图 像 对 高 频 





部 分 进行 滤波 所 得 的 近似 表 
图 像 中 所 检测 不 到 的 边缘 。 
下 面 为 利用 小 波 包 分 解 检测 图 像 边 缘 的 应 用 举例 程序 代码 。 


% 载 入 并 显示 原始 图 像 
load bust 

% 加 入 含 品 
init=2055615866; 
randn('seedvinit; 
XI1=X+20+randn(size(X)); 
subplot(2,2,1);image(X1T; 
colormap(map); 

axis square; 


示 。 经 滤波 后 ， 近 似 部 分 去 除了 高 频 分 量 ， 因 此 能 够 检测 到 原始 











% 利 用 小 波 db4 对 图 像 X 进行 一 层 小 波 包 分 解 
T=wpdec2(X1,1vdb47); 

% 重 构图 修 
A=wprcoeftT,[1 0]); 
Subplot(2,2,2);image(A); 
quare; 

则 边缘 

图 像 的 边缘 检测 
Bl1=edge(A,sobel); 
J:imshow(B1); 














% 图 像 近似 部 分 的 边缘 检测 
B2=edge(X1,sobel?; 
subplot(2,2,4),imshow(B2); 


axis square 


执行 程序 代码 ， 效 果 如 图 9-25 所 示 。 
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图 9-25 图像 边缘 检测 结果 
像 b) 图 像 近 似 部 分 e) 近似 部 分 边缘 d) 原始 图 像 的 边缘 





对 近 
法 的 效果 更 灵 
需要 指出 的 是 ， 这 里 采用 的 是 一 种 最 为 简单 的 边缘 检测 算 际 上 ， 基 于 小 波 的 图 像 
边缘 检测 技术 发 展 非常 迅速 ， 近 些 年 已 经 诞生 了 很 多 种 新 颖 的 技术 和 方法 ， 如 多 尺度 小 波 变 
换 边 界 提取 算法 、 媒 入 可 信 度 的 边缘 检测 方法 、 奇 异 点 模 极 大 值 检测 算法 等 。 感 兴趣 的 读者 






像 进 行 边缘 检测 的 结果 和 直接 对 原始 图 像 进 行 边缘 检测 的 结果 相 比 ， 前 一 种 方 









包 





可 以 查阅 其 他 相关 资料 。 


9.6 小波 包 与 图 像 消 噪 


在 本 节 中 ， 小 波 包 分 析 进 行 图 像 消 噪 处 理 的 基本 原理 和 方法 与 前 面 分 绍 的 对 信和 号 消 噪 的 
相同 。 本 节 仅 以 具体 的 实例 来 说 明 小 波 包 分 析 在 图 像 消 噪 处 理 中 的 应 用 。 
在 MATLAB 的 小 波 工具 箱 中 ， 提 供 了 一 个 wpdencmp0 函 数 ， 它 是 专门 利用 小 波 包 分 解 
实现 消 噪 和 压缩 处 理 的 。 
Wpdencmp0 函 数 的 语法 格式 为 
@ _[XD,TREED,PERFO,PERFL2]=wpdencmp(CX,SORH,.N,wnamevCRITPAR.KEEPAPP) 
@ [XD,TREED,PERFO,PERFL2]=wpdencmp(TREE,SORH,CRITPAR.KEEPAPP) 
【使 用 说 明 】 利 用 小 波 包 实 现 信号 和 图 像 的 消 品 或 压缩 。 
输入 参数 ， SORH 指定 选取 软 阔 值 (SORH='S') 或 硬 阔 值 (SORH='H'); N 为 小 波 分 解 
的 层 数 ，wname 指定 分 解 时 所 用 的 小 波 ，CRIT 和 PAR 定义 了 箭 准则 ;TREE 是 小 波 包 分 解 
输出 参数 : PERFO,PERFL2 返回 压缩 比例 系数 。 
利用 小 波 包 变换 对 一 个 二 维 含 噪 图 像 进行 消 噪 处 理 。 
% 装 载 并 显示 原始 图 像 
load Fximage\fs13 
subplot(2.2.1); 
image(X); 
colormap(map); 
title( 原始 图 像 ); 


axis square; 


% 在 图 像 中 加 入 噪声 
init=2055615866; 
randn(seedvinib; 
XI1=X+10*randn(size(CX)); 
subplot(2,2,2); 

image(X1); 
colormap(map); 

title(' 含 噪 图 像 ); 


axis square; 


% 基 于 小 波 包 的 消 噪 处 理 

thr=10;sorh='s'; 

crit-shannon'; 

keepapp=0; 
X2=wpdencmp(Xl,sorh,3,sym4'vcribthrkeepapp); 


% 画 出 消 噪 后 的 图 像 
subplot(2,2.3); 








image(X2); 
colormap(tmap); 
title(' 全 局 闪 值 消 噪 图 像 ); 


axis square; 人 
% 对 图 滑 处 理 以 增强 消 噪 效果 〈 中 值 滤波 ) 
fo 











forj=2:259 
Xtemp=0; 





form=1 
forn=1:3 
Xtemp=Xtemp+X2(iHm-2j+Hn-2); 
end 
end 
Xtemp=Xtempy/9; 
X30Jj)=Xtemp; 
end 
end 
% 显 示 平 滑 结果 
subplot(2,2,4); 
image(X3); 
colormap(map); 
title( 平 滑 后 的 图 像 ); 


axis square; 

计算 结果 如 图 9-26 所 示 ， 其 中 图 9-26a 是 原始 的 图 像 ， 图 9-26b 是 添加 噪声 后 的 图 像 ， 
通过 小 波 包 分 解 并 设置 全 局 阔 值 ， 消 噪 后 的 结果 如 图 9-26c 所 示 ， 与 含 噪 图 像 相 比 ， 明 显 清楚 
了 很 多 ， 进 一 步 对 消 噪 后 的 图 像 进行 平滑 处 理 ， 如 图 9-26d 所 示 ， 与 消 噪 后 的 图 像 相 比 ， 它 明 
显 光滑 了 。 
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图 9-26 ”基于 小 波 变换 的 图 像 消 噪 


引 原始 图 像 b) 含 噪 图 像 “) 全 局 闭 值 消 噪 图 像 ”d) 平 消 后 的 图 像 








除了 利用 函数 wpdencmpO 对 图 像 进 行 消 噪 外 ， 还 可 以 利用 二 维 小 波 包 分 解 函数 wpdec20) 


来 实现 图 像 消 噪 。 
wpdec2() 函 数 的 语法 格式 为 
@ T=wpdec2(X,N,'wname',E,P) 
@ IT=wpdec2(X,N,wname) 
【使 用 说 明 】 二 维 小 波 包 分 解 。 


输入 参数 : X 是 分 析 和 矩阵 ; N 是 分 解 的 层 数 ，wname 是 小 波 基 函 数 ，E 是 箭 的 类 型 ，P 


是 依赖 于 下 的 可 选 参数 。 
输出 参数 : T 返回 小 波 包 树 。 


利用 二 多 

















稚 小 


% 装 载 并 显示 原始 图 像 
load Fximagewfs06 
subplot(2,2,1); 
image(X); 
colormap(map); 

title( 原始 图 像 ); 


axis square; 


%% 生 成 含 噪 图 像 
init=2055615866; 
randn(seed',init; 
X1=X+20*randn(size(X)); 
subplot(2,2.2); 

image(X1); 
colormap(tmap); 

title( 含 噪 图 像 ); 


axis square; 


\ 波 包 分 解 对 一 个 二 维 含 噪 图 像 进行 消 噪 处 理 。 


% 用 小 波 sym2 对 图 像 X1 进行 一 层 小 波 包 分 解 


T=wpdec2(X11,sym27; 


%% 设 置 闪 值 
thr=8.342; 


% 对 图 像 的 小 波 包 分 解 系数 进行 软 阔 值 量化 
NT=wpthcoeftT,0,svthn; 


% 仅 对 低频 系数 进行 重 构 
X2=wprcoeftNT,D; 


% 画 出 消 噪 后 的 图 像 
subplot(2,2.3); 
image(X2); 
colormap(map); 





title(' 消 噪 后 的 图 像 ); 


axis square; 





计算 结果 如 图 9-27. 所 示 ， 其 中 图 9-27a 是 原始 的 图 像 ， 图 9-27b 是 添加 噪声 后 的 图 
像 ， 通 过 二 维 小 波 包 分 解 后 并 对 系数 进行 闪 值 化 处 理 后 ， 重 构 的 图 像 如 图 9-27c 所 示 ， 与 含 他 ) 


噪 图像 相 比 ， 它 明显 清楚 了 很 多 ， 达 到 了 消 噪 的 效果 
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图 9-27 基于 二 维 小 波 包 分 解 的 图 像 消 噪 
司 原始 图 像 b) 含 品 图 像 ec) 消 噪 后 的 图 像 


9.7 小结 





本 章 主要 讲述 了 小 波 技术 在 图 像 处 理 中 的 应 用 。 首 先 介绍 了 小 波 分 析 的 基础 知识 ， 包 括 
一 维 小 波 变换 的 基本 原理 、 二 维 小 波 变换 和 多 分 辩 率 分 析 以 及 小 波 工具 箱 的 图 像 处 理 功能 。 
然后 介绍 了 小 波 用 于 图 像 降 噪 、 图 像 压缩 、 图 像 增强 和 图 像 融合 的 基本 原理 和 MATLAB 实 
现 方法 。 本 章 介绍 的 大 多 是 最 基本 和 简单 的 用 法 。 由 于 小 波 分 析 和 图 像 处 理 技术 都 在 不 断 发 
展 之 中 ， 所 以 新 的 研究 内 容 和 处 理 算法 层出不穷 ， 读 者 可 以 针对 感 兴趣 的 内 容 查询 相关 的 资 


料 以 供 进一步 研究 。 











第 10 章 图 像 特 征 的 描述 


图 像 描述 是 图 像 处 理 的 核心 内 容 。 为 了 便于 有 效 地 研究 和 应 用 ， 往 往 需要 用 一 些 简单 明 






图 来 表征 给 定 的 图 像 及 已 分 割 的 图 像 区 
生 的 ， 反 映 了 图 像 或 图 像 区 域 的 基本 信息 和 主 
号 或 图 为 图 像 的 特征 ， 而 用 这 些 特征 表示 图 像 称 为 图 像 描述 。 


10.1 灰 度 描述 


所 有 的 图 像 特征 中 ， 最 基本 的 是 图 像 的 幅度 特征 。 可 以 在 某 一 像素 点 或 其 领域 内 做 出 
幅度 的 测量 ， 如 在 Wx N 区 域内 的 平均 幅度 ， 


1)= 碳 0 刀 5C10-1) 


气 气 

可 以 直接 从 图 像 像素 的 灰 度 值 ， | 非 线性 变换 后 构成 新 的 图 像 幅 度 的 空 
来 求 得 各 式 各 样 图 像 的 幅度 特征 图 。 图 像 的 幅度 特征 对 于 分 离 目标 物 的 描述 等 具有 十 4 
的 作用 。 如 图 10-1 所 示 ， 其 中 图 10-1a 是 原始 图 像 ， 图 10-1b 是 利用 幅度 特征 将 
快艇 分 割 出 来 的 结果 。 






数值 图 是 按 - 定 












图 10-1 灰 度 信息 





对 目标 进行 分 割 
到 原始 图 像 b) 幅度 特征 分 割 结果 

















- 幅 数 字 图 像 可 以 看 成 是 一 个 二 维 随机 过 程 的 一 个 样本 ， 可 以 用 联合 概率 分 布 来 描述 。 
通过 对 图 像 的 各 像素 幅度 值 可 以 设法 估计 出 图 像 的 概率 分 布 ， 从 而 形成 图 像 的 直方 图 特征 。 











图 像 亦 度 的 一 阶 概率 分 布 定义 为 
PO=PUCc)= 由 (0 过 bp 生 Z-D (10-2) 


式 中 ，0 为 量化 值 ; 为 量化 值 范围 ， 即 
PCUD) = (10-3 


式 中 ，M 为 围绕 (xy 点 被 测 窗 口内 的 像素 总 数 ， N(b) 为 该 窗口 内 灰 度 值 为 沪 的 像素 总 数 。 


N(D) 
AMf 


间 


图 像 的 直方 图 特征 可 以 提供 图 像 信息 的 许多 特征 。 例 如 ， 若 直方 图 密集 地 分 布 在 很 窄 的 





区 域内 ， 说 明 图 像 的 对 比 度 很 低 ， 若 直方 图 有 两 个 峰值 ， 则 说 明 存在 着 两 种 不 同 亮度 的 区 域 。 
一 阶 直 方 图 的 特征 参数 有 


豆 
平均 值 : 5 = > pP(D) 
b=0 


加 
方差 : 叹 = >- 站 2PU) 
=0 


本 
倾斜 度 : 饭 = 占 》 -六 2PO) 
Co pc0 
1 
睛 度 : 皮 = 二 -DPCO)-3 
Co =0 


局 
能 量 ，bv = 》 [PC 
b=0 


汪 
PCO)log:[PO] 


筷 


灶 : 号 = 





二 阶 直 方 图 特征 是 以 像素 对 的 联合 概率 分 布 为 基础 得 出 的 。 若 两 个 像素 Fi, 门 及 


rm 由 分 别 位 于 亿 亡 点 和 (ms 品 点 ， 两 者 的 间距 为 | 一 可 、|/ 川 ， 并 可 用 极 伦 标 六 、6 表 
达 ， 那 么 其 幅度 值 的 联合 分 布 为 
Pa.D)AR {7G 放 -am 一 丰 〈10-4) 
式 中 ，a、5 为 量化 的 幅度 值 。 因 此 ， 直 方 图 估 值 的 二 阶 分 布 为 
Po) 一 区 (10-5) 





式 中 ，N(a,j 表示 在 图 像 中 ， 在 6 方向 上 、 径 向 间距 为 p 的 像素 对 7 六 =a， nm. 站 = 


出 现 的 频数 ，M 为 测量 窗口 中 像素 的 总 数 。 
假设 图 像 的 各 像素 对 都 是 相互 关联 的 ， 则 P(a,D 将 在 陈列 的 对 角 线 上 密集 起 来 。 以 
列 出 的 一 些 度量 ， 用 来 描述 围绕 P(a,2) 对 角 线 能 量 扩散 的 情况 。 
所 总 
自 相关 : B4 = > > abP(a 愈 
aq=0 b=0 
所 名 


协 方差 ， Be = > 》(a- 5 - 妃 PlaD) 


ac0 50 


5 


MATLAB Rs 





惯性 矩 ， 8 = 2 2)P(a,D) 
允 


绝对 值 : By = 汉 汪 咱 P(a.D 


能 量 : Bx = y [Pa， b 





下 
由 于 图 像 的 二 维 变换 得 出 的 系数 反映 了 二 维 变换 后 图 像 在 频 域 的 分 布 情况 ， 因 此 常常 用 
- 维 的 傅 里 叶 变 换 作为 一 种 图 像 特征 的 提取 方法 。 例 如 : 
Foon= [ConePedrdy (10-6) 
设 Muwv) 是 Fwyv) 的 平方 值 ， 即 
Me)=|FGe 中 (10-7) 
当 Cocy) 的 原点 有 了 位 移 时 ， M(xwv) 的 值 保持 不 变 ， 因 此 Muwv) 与 Fwv) 不 是 唯一 
对 应 的 ， 这 种 性 质 称 为 位 移 不 变性 ， 在 某 些 应 用 中 可 利用 这 一 特点 。 
如 果 把 Muww) 在 某 些 规定 区 域内 的 累计 值 求 出 ， 也 可 以 把 图 像 的 某 些 特征 突出 起 来 ， 
这 些 规定 的 区 域 如 图 10-2 所 示 ， 其 中 图 10-2a 为 水 平 切口 ， 图 10-2b 为 垂直 切口 ， 图 10-2c 








为 环形 切口 。 

沁 尖 YY 个 

Wi 1 

vtrD) 人 训 

Ar 
VD) 亲 
OO 天 检 0 莫 
apn) amnr+1) 
Ai We 
四 卓 日 


图 10-2 ”不 同类 型 的 切口 
a) 水 平 切口 b) 垂直 切口 9 环形 切口 
由 各 种 不 同 切口 规定 的 特征 度量 可 由 下 面 各 式 来 定义 。 
水 平 切口 ，Si(o) = 站 wen 


垂直 切口 ，S,(m) = 站 ”weondv 


环 状 切口 ， Si(m= 人 ”Mo.bdp 





像 特征 的 描述 





式 中 ，AM(p,6) 为 MCwy) 的 极 坐标 式 。 

这 些 特征 说 明了 图 像 中 含有 这 些 切 口 的 频谱 成 分 的 含量 。 把 这 些 特 征 提 取出 来 以 后 ， 可 
以 作为 模式 识别 或 分 类 系统 的 输入 信息 。 这 种 方法 已 经 成 功 地 运用 到 土地 情况 分 类 、 放 射 照 
片 病情 诊断 等 方面 。 


10.2 ”纹理 分 析 


目前 还 没有 统一 和 公认 的 有 关 纹 理 的 确切 定义 。 一 般 情 况 下 把 类 似 于 布 纹 、 草 地 、 砖 
头 、 南 面 等 具有 重复 性 结构 的 图 像 称 为 纹理 图 像 。 纹 理 图 像 在 局 部 区 域内 可 能 呈现 不 规则 
性 ， 但 整体 上 则 表现 出 一 定 的 规律 性 ， 其 灰 度 分 布 往往 表现 出 某 种 周期 性 。 纹 理 图 像 所 表现 
出 的 这 种 特有 的 性 质 称 为 纹理 。 实 际 中 很 多 图 像 具 有 纹理 型 结构 ， 对 这 类 纹理 型 图 像 可 以 通 
过 纹理 分 析 取 其 宏观 特征 信息 。 


纹理 一 词 最 初 指 纤维 物 的 外 观 ， 纹 理 图 像 在 很 大 范围 内 没有 重大 细节 变化 ， 在 这 些 区 域 
内 图 像 往往 显示 出 重复 性 结构 。 有 时 ， 物 体 在 纹理 上 与 其 周围 背景 和 其 他 物体 有 区 别 、 这 时 
图 像 分 割 应 以 纹理 为 基础 。 虽 然 纹理 目前 尚 无 统一 的 定义 ， 但 一 般 来 说 ， 纹 理 是 由 许多 相互 
接近 的 、 互 相交 织 的 元 素 构成 ， 它 们 具有 周期 性 。 纹 理 在 一 定 程度 上 反映 了 一 个 区 域 中 像素 
灰 度 级 的 空间 分 布 的 属性 。 

纹理 可 分 为 人 工 纹 理 和 天 然 纹理 〈 自 然 纹 理 )。 人 工 纹理 由 某 种 符号 的 有 序 排 列 组 成 
这 些 符号 可 以 是 线条 、 点 、 字 母 、 数 字 等 。 自 然 纹 理 是 具有 重复 排列 现象 的 自然 景象 ， 如 夸 
墙 、 种 子 、 森 林 、 草 地 之 类 的 照片 。 图 10-3a 是 常见 的 人 工 纹理 结构 ， 图 10-3b 是 常见 的 自 
然 纹理 结构 。 由 此 可 见 ， 人 工 纹理 往往 是 有 规则 的 ， 而 自然 纹理 往往 是 无 规则 的 。 











b 
图 10-3 ”典型 的 纹理 结构 图 


aj 人 工 纹理 bj) 自然 纹理 


归纳 起 来 ， 对 纹理 的 认识 有 两 种 看 法 。 一 种 是 赁 人 们 的 直观 印象 ， 而 另 一 种 是 凭 图像 本 
身 的 结构 。 从 直观 印象 出 发 的 方法 包含 有 心理 学 因素 ， 这 样 就 会 产生 多 种 不 同 的 统计 纹理 特 
性 ， 从 这 一 观点 出 发 ， 纹 理 分 析 应 该 采用 统计 法 ， 从 图 像 结 构 观点 出 发 ， 则 认为 纹理 是 一 种 


训 











结构 ， 根 据 这 一 观点 ， 纹 理 分 析 应 该 采用 句法 结构 法 。 

描述 图 像 特性 的 参数 有 很 多 种 ， 对 纹理 图 像 来 说 有 必要 知道 各 个 像素 及 其 邻近 像素 
的 灰 度 分 布 情况 。 了 解 邻 近 像素 灰 度 值 变化 情况 的 最 简单 方法 是 取 1 阶 微分 、2 阶 微分 的 
平均 值 与 方差 ， 如 果 要 考虑 纹理 的 方向 性 特征 ， 则 可 考察 9 方向 与 (9+/2) 方 向 差分 的 
平均 值 与 方差 。 纹 理 分 析 常用 的 方法 有 统计 法 、 自 相关 函数 法 、 频 谱 法 、 句 法 结构 法 和 
殿 合 概率 矩阵 法 等 。 





10.2.2 

统计 法 是 利用 图 像 内 某 一 区 域 或 物体 的 灰 度 直方 图 的 纹理 结构 进行 描述 ， 它 又 可 以 分 为 
人 长 度 统计 法 。 

1. 灰 

取 图 像 内 任意 一 点 (x 六 ， 设 与 该 点 相 邻 的 点 (x+ Ax,y + Ay) 的 灰 度 差 值 为 

SACo)=S00 们 一 SOC+Acy+A) (10-8) 

式 中 ，gA(Ccy) 称 为 灰 度 差分 。 若 gs(Cxcy) 的 所 有 可 能 取 值 共有 严 级 ， 则 令 (x,y) 在 整个 区 域 
上 移动 ， 统 计 出 gs(x,y) 取 各 个 灰 度 级 的 次 数 ， 由 此 作出 gs(x,y) 的 直方 图 。 根 据 直 方 图 可 
以 得 出 gs(x,y) 取 不 同 灰 度 值 的 概率 mA(D 。 

若 宇 取 值 较 小 ， 而 概率 Ps(D) 较 大 ， 则 说 明 纹 理 较 粗糙 ， 若 概率 Ps(i) 较 平 坦 ， 则 说 明 纹 
理 较 细密 。 

灰 度 差分 统计 法 一 般 采 用 以 下 参数 描述 纹理 图 像 的 特征 。 








对 比 度 : CON= > PPpsO) (10-9) 

角度 方向 二 阶 矩 : 4sM -DO (10-10) 

简 : Br- 了 moOlemg (10-11) 
了 冯 O 

平均 值 : ME4N = 一 六 (10-12) 


根据 上 述 公 式 ， 若 愉 (D) 较 平坦 ， 则 4SWM 较 小 ， 而 NT 较 大 ; 若 玖 全 分 布 在 原点 附 


近 ， 则 ME4N 较 小 。 
2. 行程 长 度 统 计 法 
设 图 像 内 任意 一 点 (x,y) 的 灰 度 值 为 g， 与 其 相 邻 点 的 灰 度 值 也 可 能 为 g 或 其 他 值 ， 统 
计 出 从 任意 一 点 出 发 沿 2 方向 上 连续 个 点 都 具有 灰 度 值 g 所 发 生 的 概率 ， 记 此 概率 为 
P(g, 吕 ) 。 在 同一 方向 上 具有 相同 灰 度 值 的 像素 点 的 数量 称 为 行程 长 度 。 根 据 P(g,m) 可 以 定 
闻 2p(g 四 


行程 加 重 法 : ZRE = 生 一 一 一 (10-13) 


em 中 





特征 的 描述 





2 
习 Zveo] 
灰 度 值 分 布 : LRE= 二 起 -一 
2 pg 中 


3 


ZRFE = 一 二 -一 (10-15) 
盖 Plg 中 


pg 由 


行程 行 ; ZLRE= 到 有 (10-16) 
式 中 ，N 为 图 像 的 像素 总 数 。 


| 10.23| 自 相关 函 | 


物体 的 纹理 常用 其 粗糙 性 加 以 描述 。 例 如 ， 在 相同 的 外 观 条 件 下 ， 毛 织品 一 般 比 丝织品 
粗糙 。 粗 糙 性 的 程度 与 局 部 结构 的 空间 重复 周期 性 有 关 ， 周 期 大 的 纹理 细 : 反之 则 纹理 粗 
糙 。 这 种 感觉 上 的 粗糙 虽然 不 足以 定量 表示 纹理 的 测度 ， 但 可 说 明 纹理 测度 的 变化 趋势 ， 即 
纹理 测度 小 表示 纹理 比较 细密 ;纹理 测度 值 大 表示 纹理 比较 粗糙 。 

设 图 像 以 .Fom, 门 表示 ， 则 自 相关 函数 可 定义 如 下 ; 


He 


六 jz-em- 帮 


Ce 万 间 = 下 


LU 


忆 盖 Un 


wm 六 wm= 广 w 


式 〈10-17) 是 对 (2w+Dx(2w+D) 窗 口内 的 每 一 个 像素 点 (7k) 与 偏离 值 为 es7=0， 
士 ],+2,…,+7 的 像素 之 间 的 相关 值 进行 计算 。 一 般 纹理 区 对 给 定 偏离 (s,7) 量 的 相关 性 要 比 细 
， 因 而 纹理 粗糙 性 与 自 相 关 函 数 的 扩展 成 正比 。 自 相关 函数 扩展 的 一 种 测度 就 是 
义 如 下 : 


《10-14) 


行程 长 度 分 布 : 





〈10-17) 








呈 1 
rD= 疡 六 = PC(e: 岂 六 有 (10-18) 


ec=-To=-7 


纹理 越 粗 糙 ， 则 T(7, 如 越 大 。 因 此 ， 可 以 用 7(C7, 如 作为 度量 纹理 粗糙 程度 的 参数 之 一 。 





频谱 法 即 傅 里 叶 频 谱 法 ， 指 依据 傅 里 叶 频 谱 的 频率 特性 来 描述 周期 的 或 近似 周期 的 二 维 
图 像 纹 理 结构 。 对 于 图 像 而 言 ， 二 维 傅 里 叶 变换 如 下 : 
Foon= 三 三 Joserndndy (lo0-19) 
- 维 傅 里 叶 变 换 的 功率 谱 如 下 ; 
已 =|Foovjl= FF (10-20) 


计 








健 里 时 频谱 中 突起 的 峰值 对 应 纹理 模式 的 主 方向 ， 峰 值 在 频 域 平面 的 位 置 对 应 模式 的 基 
本 周期 ， 若 采用 滤波 将 周期 性 成 分 滤 除 ， 则 剩 下 的 非 周期 性 部 分 可 用 统计 法 描述 。 

实际 应 用 中 ， 一 般 将 频谱 先 转换 到 极 坐标 系 中 ， 如 图 10-4 所 示 ， 此 时 傅 里 叶 变换 可 用 
F(r,6) 表 示 ， 其 频谱 可 用 函数 S(r,6)=|F(r,6 站 表示 。 





?个 
下 
8 
用 
有 B 
本 划 
图 10-4 ”纹理 和 对 应 的 频谱 示意 图 


对 每 个 确定 的 方向 ，S(r,6) 是 一 个 一 维 函 数 Sr) ;对 每 个 确定 的 频率 r，S(r,6) 是 一 
个 一 维 函 数 S(O) 。 对 给 定 的 6 ， 分 析 SCr) 可 得 到 频谱 沿 原点 射出 方向 的 行为 特性 ， 对 给 定 
的 mn 分析 S(b) 可 得 到 频谱 在 以 原点 为 中 心 的 圆 上 的 行为 特性 。 如 果 将 这 些 函数 积分 ， 则 可 
得 到 更 为 全 局 性 的 描述 ， 即 
SO= 人 [Feede 
〈10-21) 
SO= 人 IFCeoPdr 


如 果 是 离散 图 像 ， 则 将 上 述 积分 分 别 以 求 和 代 蔡 ， 即 可 得 出 相应 的 公式 ， 即 将 这 些 函数 
序列 分 别 对 6 或 > 求 和 ， 同 样 可 得 到 沿 某 一 角度 9 方向 和 半径 > 方向 的 全 局 性 的 描述 ， 即 
SO)=> Fr, 6 站 =sS0,O) (10-22) 
5 5 


SO)=y> Fe,6 站 = 包 S0.9) (10-23) 


Sr) 和 S(O) 构 成 整个 图 像 或 图 像 区 域 的 纹理 频谱 能 量 描述 。 如 果 较 小 ，S(C) 很 大 ; 
或 > 很 大 ，S(Ur) 却 较 小 ， 则 说 明 是 粗糙 性 纹理 结构 ， 反 之 ， 如 果 变 化 对 SC) 的 影响 较 
小 ， 则 为 细密 的 纹理 结构 。 在 纹理 粗糙 的 情况 下 ， 能 量 多 集中 在 离 原 点 很 近 的 范围 内 ， 即 
图 10-4b 中 的 曲线 4， 而 对 于 纹理 较 细 的 情况 下 ， 能 量 分 布 在 离 原 点 较 远 的 范围 内 ， 即 
图 10-4b 中 的 曲线 B。 


由 纹理 的 句法 结构 分 析 ; 


在 纹理 的 句法 结构 分 析 中 ， 将 纹理 定义 为 结构 基 元 按 某 种 规则 重复 分 布 所 构成 的 模式 。 
进行 纹理 结构 分 析 ， 需 要 先 描述 结构 基 元 的 分 布 规律 。 因 此 ， 一 般 可 进行 如 下 两 项 工作 。 

1) 从 输入 图 像 中 提取 结构 基 元 并 描述 其 特征 。 

2) 描述 结构 基 元 的 分 布 规则 。 具 体 方法 如 下 : 




















首先 将 纹理 图 像 分 成 许多 窗口 ， 即 形成 子 纹理 。 其 中 最 小 的 小 块 就 是 最 基本 的 子 纹理 
( 即 基 元 )。 纹 理 基 元 可 以 是 一 个 像素 ， 也 可 以 是 4 个 或 9 个 灰 度 比较 一 致 的 像素 集合 。 纹 
理 的 表达 可 以 是 多 层次 的 ， 如 图 10-5a 所 示 ， 它 可 以 从 像素 或 小 块 纹理 一 层 一 层 地 向 上 拼 
合 。 而 且 ， 基 元 的 排列 可 有 不 同 规则 ， 如 图 10-S$b 所 示 ， 第 一 级 纹理 排列 为 ABA， 第 二 级 
排列 为 BAB 等 ， 其 中 A、B 代表 基 元 或 子 纹理 ， 于 是 就 组 成 了 一 个 多 层 的 树 状 结构 ， 可 用 
树 状 文法 产生 一 定 的 纹理 ， 并 以 句法 加 以 描述 。 

纹理 的 树 状 排列 可 有 多 种 方法 。 如 图 10-5d 所 示 ， 树 根 安 排 在 中 间 ， 树 枝 向 两 边 伸 出 ， 
每 个 树枝 有 一 定 的 长 度 。 又 如 图 10-$c 所 示 ， 树 根 安排 在 一 人 出， 分 枝 都 向 另 一 侧 伸展 。 


























纹理 图 像 
第 -级 |A| B |A 
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站 岂可 
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办 站 
Si 0 
日 由 
图 10-5 纹理 的 树 状 描述 及 排列 
纹理 判别 可 用 以 下 方法 : 


首先 将 纹理 图 像 分 成 固定 尺寸 的 窗口 ， 用 树 状 文法 说 明 属于 同 纹理 图 像 的 窗口 ， 可 以 用 
树 状 自动 机 识别 树 状 ， 因 此 ， 对 每 一 个 纹理 文法 可 建立 一 个 “结构 保存 的 误差 修正 树 状 自动 
机 ”。 该 自动 机 不 仅 可 以 接受 每 个 纹理 图 像 中 的 树 ， 而 且 能 用 最 小 距离 判 据 辨识 类 似 的 有 品 
声 的 树 。 以 后 ， 可 以 对 任意 一 个 分 割 成 窗口 的 输入 图 像 进行 分 类 。 


联合 概率 矩阵 法 





联合 概率 矩阵 法 是 通过 对 图 像 的 所 有 像素 进行 统计 并 描述 其 灰 度 分 布 的 一 种 方法 。 取 图 
像 中 任意 一 点 (xy) 及 偏离 它 的 另 一 点 (x+wy+ 刀 组 成 一 个 点 对 ， 设 该 点 对 的 灰 度 值 为 
(gg?) 。 令 点 (cy) 在 所 分 析 的 区 域内 移动 ， 则 可 得 到 全 部 的 (8i,8:) 值 。 若 灰 度 值 的 级 数 
为 k， 则 (gl,g:) 共 有 8 种 组 合 。 对 于 整个 区 域 ， 统 计 出 每 一 个 (g\,8g2) 值 出 现 的 次 数 ， 然 后 
排 成 一 个 方 阵 ， 再 用 (&,g。) 出 现 的 总 数 将 其 归 一 化 为 出 现 的 概率 PCsi,g3) ， 这 样 的 方 阵 称 
为 联合 概率 矩阵 ， 又 称 为 灰 度 共生 矩阵 或 灰 度 共 现 矩 阵 。 

图 10-6 为 一 个 简单 的 例子 。 图 10-6a 为 原始 图 像 ， 共 有 16 个 灰 度 级 ， 为 使 概率 矩阵 
简单 起 见 ， 首 先 将 图 10-6a 的 灰 度 级 减 为 4 级 ， 变 为 图 10-6b 的 形式 。(g,,82) 分 别 取 值 为 
0、1、2、3， 故 可 以 将 (gl,g?) 各 种 组 合 出 现 的 次 数 排列 起 来 ， 可 以 得 到 如 图 10-6c 一 e 所 
示 的 联合 概率 和 矩阵， 以 图 10-6c 中 的 频数 10 为 例 ， 该 数据 表示 图 10-6b 中 灰 度 值 为 《0,1)， 


<283 





共 出 现 10 次 ， 其 余 可 以 类 推 。 

由 此 可 见 ， 差 分 值 (ob) 取 不 同 的 数值 ， 就 可 以 得 到 不 同情 况 下 的 联合 概率 矩阵 。 
(ob) 取 值 要 根据 纹理 周期 分 布 的 特性 进行 选择 ， 对 于 较 细 的 纹理 ， 选 取 (0,1)、(L1)、 
(2,0) 等 较 小 的 差分 值 ， 即 ae、4 取 值 较 小 时 ， 对 应 于 变化 缓慢 的 纹理 结构 ， 其 联合 概率 矩 
阵 对 角 线 上 的 数值 较 大 。 若 纹理 的 变化 越 快 ， 则 对 角 线 上 的 数值 就 越 小 ， 对 角 线 两 侧 的 元 素 
值 却 增 大 。 为 了 能 描述 纹理 的 状况 ， 有 必要 选取 能 综合 反映 联合 概率 矩阵 状况 的 参数 ， 典 型 















































的 有 如 下 几 种 : 
2 6 10 14 党 6 10 0 1 2 坦 0 1 要 
6 10 14 和 6 10 14 1 2 村 0 1 娄 基 
10 14 2 6 10 14 2 党 于 0 1 2 3 0 
14 过 6 10 14 入 6 洒 0 1 2 和 0 1 
全 6 10 14 2 6 10 0 1 2 过 0 1 2 
6 10 14 2 6 10 14 1 2 剖 并 1 普 3 
10 14 2 6 10 14 2 当 椰 0 2 重 0 
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和 下放 工 丽 硅 站 人 Il|o 0 0 10 
2| 0 0 0 11 2|10 0 10 0 过 | 3 人 0 0 0 
3lio oo 最 [有 下 和 有 沁 让 亲生 下 
一 GT 一 GT 一 GD 
(a=1.b=0) (a=1Lb-0) (a=1.b=0) 
昌 昌 日 
图 10-6 灰 度 共生 矩阵 计算 方法 
(1) 角 二 阶 托 
角 二 阶 矩 是 图 像 谈 度 均匀 性 的 一 种 度量 。 
Q= 包 >[p(g,s 下 (10-24) 
中 更 
(2) 惯性 矩 


惯性 矩 又 称 为 对 比 度 ， 可 以 理解 为 图 像 的 清晰 度 ， 在 图 像 中 纹理 的 纹 沟 越 深 ， 对 比 度 则 
越 大 ， 图 像 的 视觉 效果 越 清晰 。 


oa -Ze 了 Zree| 《10-25) 
下 8 82 


式 中 ， 上 = 8 一 8 。 〈《10-26) 
(3) 相关 性 
相关 性 用 于 衡量 灰 度 共生 矩阵 的 元 素 在 行 或 列 方向 上 的 相似 程序 。 
> ggp(e8) -人 人 
人 (10-27) 


CuxOy 








特征 的 描述 


久 =282 pg) |[ 轩 = 闷 (Ap ps) 
富 汪 和 < 


臣 中 ， 
2 已 = 六 8 > pg8) | 加 = (es -MA)》 pg,s) 
2 本 本 


〈10-28) 


(4) 炳 包 
科 是 图 像 具 有 的 信息 量 的 一 种 度量 ， 纹 理 信息 也 是 图 像 的 信息 ， 若 一 幅 数字 图 像 没 有 纹 
理 ， 则 灰 度 共生 矩阵 接近 为 零 矩 阵 。 
2 = -> pgbg)lgp(ei8) (10-29) 


[3 
尽管 、 包 、2  、2 代表 的 图 像 特征 并 不 是 很 直观 ， 但 它们 是 描述 纹理 特征 非常 有 
效 的 参数 。 


10.3 “形状 描述 





1. 链 码 简介 

链 码 〈Chain Code) 在 图 像 处 理 和 模式 识别 中 是 常用 的 一 种 表示 方法 ， 它 最 初 是 由 Free- 
mam 于 1961 年 提出 来 的 ， 用 来 表示 线条 模式 ， 至 今 它 仍 被 广泛 使 用 。 根 据 链 的 斜率 不 同 
常用 的 有 4 方向 和 8 方向 链 码 ， 其 方向 定义 分 别 如 图 10-7a 和 图 10-7b 所 示 。 在 4 方向 链 码 
中 ，4 个 方向 码 的 长 度 都 是 一 个 像素 单位 ; 在 8 方向 链 码 中 ， 水 平和 垂直 方向 的 方向 码 的 长 
度 都 是 一 个 像素 单位 ， 而 对 角 线 方向 的 4 个 方向 码 为 像素 单位 的 V2 倍 。 因 此 ， 它 们 的 共同 
特点 是 直线 段 的 长 度 固定 ， 方 向 数 有 限 ， 故 可 以 利用 一 系列 具有 这 些 特 点 的 相连 的 直线 段 来 








表示 目标 的 边界 ， 这 样 只 有 边界 的 起 点 需要 用 绝对 坐标 表示 ， 其 余 点 都 可 只 用 接续 方向 来 代 
表 偏 移 量 。 由 于 表示 一 个 方向 数 比 表示 一 个 坐标 值 所 需 比特 数 少 ， 而 且 对 每 一 个 点 又 只 需要 
一 个 方向 数 就 可 以 代替 两 个 坐标 值 ， 因 此 ， 链 码 表达 可 大 大 减少 边界 表示 所 需 的 数据 量 ， 所 
以 常用 链 码 来 作为 对 边界 点 的 一 种 编码 表示 方法 。 
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图 10-7 链 码 值 与 方向 的 对 应 关系 


从 在 物体 边界 上 任意 选取 的 某 个 起 始点 坐标 开始 ， 跟 踪 边 界 并 赋 给 每 两 个 相 邻 像素 的 连 
线 一 个 方向 值 ， 最 后 按照 道 时 针 方向 沿 着 边界 将 这 些 方向 码 连接 起 来 ， 就 可 以 得 到 链 码 。 因 
此 ， 链 码 的 起 始 位 置 和 链 码 完整 地 包含 了 目标 的 形状 和 位 置信 息 。 











例如 ， 在 如 图 10-8 所 示 的 以 a 为 起 点 、 以 箭头 为 走向 的 闭合 边界 〈 小 圆 点 处 表示 各 像 
素 点 ) 中 ， 其 8 方向 链 码 为 001711222433445676656。 
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图 10-8 以 a 为 起 点 ， 以 箭头 为 走向 的 闭合 边界 











使 用 链 码 时 ， 起 点 的 选择 是 很 关键 的 。 对 同一 个 边界 ， 如 用 不 同 的 边界 点 作为 链 码 的 起 
得 到 的 链 码 是 不 同 的 。 为 解决 这 个 问题 可 把 链 码 归 一 化 ， 具 体 做 法 为 : 给 定 一 个 从 任 
意 点 开始 产生 的 链 码 ， 把 它 看 做 一 个 由 各 方向 数 构成 的 自然 数 。 首 先 ， 将 这 些 方向 数 
按 一 个 方向 循环 ， 以 使 它们 所 构成 的 自然 数 的 值 最 小 ; 然后， 将 这 样 转换 后 所 对 应 的 
链 码 起 点 作为 这 个 边界 的 归 一 化 链 码 的 起 点 。 

2 链 码 的 旋转 不 变性 

用 链 码 表示 给 定 目标 的 边界 时 ， 如 果 目 标 平移 ， 链 码 不 会 发 生变 化 ;而 如 果 目 标 旋 
转 ， 则 链 码 会 发 生变 化 。 为 解决 这 个 问题 ， 可 利用 链 码 的 一 阶 差分 来 重新 构造 一 个 表示 
原 链 码 各 段 之 间 方向 变化 的 新 序列 ， 这 相当 于 把 链 码 进行 旋转 归 一 化 。 差 分 可 用 相 邻 的 
两 个 方向 数 按 反 方向 相 减 〈 后 一 个 减 去 前 一 个 ) 得 到 ， 如 图 10-9 所 示 。 上 面 一 行为 原 链 
码 〈 括 号 中 为 最 右面 的 方向 数 循环 到 左边 )， 下 面 一 行为 上 面 一 行 的 数 两 两 相 减 得 到 的 差 
分 码 。 左 边 的 目标 在 逆 时针 旋 转 90” 后 成 为 右边 的 形状 ， 可 见 ， 原 链 码 发 生 了 变化 ， 但 差 
分 码 并 没有 变化 。 
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图 10-9 链 码 旋转 归 一 化 


对 边界 的 离散 传 里 叶 变换 表达 可 以 作为 定量 描述 边界 形状 的 基础 。 采 用 傅 里 叶 描述 的 








个 优点 是 将 二 维 问题 简化 为 一 维 问题 ， 即 将 效 平面 中 的 曲线 段 转化 为 一 维 函 数 Jr) (在 
r-Ur) 平 面 上 )， 也 可 将 阔 平 面 中 的 曲线 段 转 化 为 复 平面 上 的 一 个 序列 。 具 体 就 是 将 z9 平 
面 与 复 平面 ww 重合 ， 其 中 ， 实 部 x 轴 与 x 轴 重 合 ， 虚 部 " 轴 与 重合， 这样 可 用 复数 x+jv 

的 形式 来 表示 给 定 边 界 上 的 每 个 点 〈 zy )。 这 两 种 表示 在 本 质 上 是 一 致 的 ， 是 点 与 点 对 应 电 
的 ， 如 图 10-10 所 示 。 
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图 10-10 边界 点 的 两 种 表示 方法 


对 于 逆 平 面 上 一 个 由 天 个 点 组 成 的 边界 来 说 ， 任 意 选 取 一 个 起 始点 (xm,m) 。 然 后 沿 着 
顺 时 针 方 向 绕 行 一 周 ， 可 以 得 到 一 个 点 序列 : (mo (Csyx) 。 如 果 记 
x(6= 乓 ,OO= 基 ， 并 把 它们 用 复数 形式 表示 ， 则 得 到 一 个 坐标 序列 : 


s(OD=x(D+jp(OD (=01 天 -D (10-30) 
s(k) 的 离散 傅 里 叶 变 换 为 
SCD)= oe Pa =01 天 =D (10-31) 





式 中 ， 傅 里 叶 系 数 SGCO 可 称 为 边界 的 信里 时 描述 子 ， 它 的 傅 里 叶 逆 变 换 为 


SC = 一 1 和 sepm (=01…K-D (10-32) 


kx 

由 于 傅 里 叶 变换 的 高 频 分 量 对 应 一 些 细节 ， 而 低频 分 量 对 应 基本 形状 ， 因 此 只 利用 
So) 的 前 M 个 系数 来 重 构 原来 的 图 像 ， 从 而 可 以 得 到 对 s(k) 的 一 个 近似 而 不 改变 其 基本 形 
状 ， 即 


本 
MD- 六 六 Sepme (=01…,K-D (10-33) 
气 


形状 特征 的 描述 





1 长 轴 和 短 轴 
当 物 体 的 边界 已 知 时 ， 用 其 外 接 矩 形 的 尺寸 来 刻画 它 的 基本 形状 是 最 简单 的 方法 ， 如 
图 10-11a 所 示 ， 求 物体 在 坐标 轴 方 向 上 的 外 接 和 矩形 ， 只 需 计 算 物体 边界 点 的 最 大 坐标 值 和 
最 小 坐标 值 ， 就 可 得 到 物体 的 水 平 跨度 和 垂直 跨度 。 但 是 ， 对 任意 朝向 的 物体 ， 水 平和 垂直 
不 一 定 是 我 们 感 兴趣 的 方向 ， 这 时 ， 就 有 必要 确定 物体 的 主轴 ， 然 后 计算 反映 物体 形状 特征 
的 主轴 方向 上 的 长 度 和 与 其 垂直 方向 上 的 宽度 ， 这 样 的 外 接 矩 形 是 物体 的 最 小 外 接 矩 形 
(Minimum External Rectangle，MER)， 如 图 10-11b 所 示 。 
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图 10-11 MER 法 求 物体 的 长 轴 和 短 轴 
到 坐标 系 方向 上 的 外 接 邱 形 b) 旋转 物体 使 外 接 和 矩形 最 小 


2 矩形 度 
图 像 区 域 面 积 4 与 其 最 小 外 接 和 矩形 的 面积 4 之 比 即 为 矩形 度 ， 
本 (10-34) 
AnER 


竹 形 度 反映 区 域 对 其 最 小 外 接 矩 形 的 充满 程度 ， 当 区 域 为 矩形 时 ， 矩 形 度 R=1.0; 当 
区 域 为 圆 形 时 ， 有 R= r/14; 对 于 边界 弯曲 、 呈 不 规则 分 布 的 区 域 ，0<R<1l。 
3 长 宽 比 
长 宽 比 ” 是 将 细 长 目标 与 近似 矩形 或 圆 形 目标 进行 区 分 时 ， 采 用 的 形状 度量 。 长 宽 比 ~ 
为 最 小 外 接 矩 形 的 宽 与 长 的 比值 ， 定 义 式 如 下 : 
取 


r= 一 ME (10-35) 
Tv 
4 贺 形 度 
圆 形 度 用 来 刻画 物体 边界 的 复杂 程度 ， 有 4 种 圆 形 度 测度 。 
〈1) 致密 度 C 
致密 度 又 称 为 复杂 度 ， 也 称 为 分 散 度 ， 其 定义 为 区 域 周 长 (P) 的 平方 与 面积 (4) 的 比 : 
这 (10-36) 
姓 


致密 度 描述 了 区 域 单位 面积 的 周 长 大 小 。 致 密度 大 ， 表 明 单位 面积 的 周 长 大 ， 即 区 域 离 
散 ， 为 复杂 形状 ;反之 ， 致 密度 小 ， 为 简单 形状 。 当 图 像 区 域 为 圆 时 ，C 有 最 小 值 4r ;图 
像 为 其 他 任何 形状 的 图 像 区 域 时 ，C > 4r ， 且 形状 越 复杂 ，C 值 越 大 。 例 如 ， 不 管 面积 多 
大 ， 正 方形 区 域 臻 密度 C=16， 正 三 角形 区 域 臻 密度 C=12V3 。 

(2) 边界 能 量 羽 

假定 物体 的 周 长 为 P， 用 变量 P 表示 边界 上 的 点 到 某 一 起 始点 的 距离 。 边 界 上 任意 一 点 
都 有 一 个 瞬时 曲率 半径 x(P) ， 它 是 该 点 与 边界 相 切 圆 的 半径 ， 如 图 10-12 所 示 。P 点 的 曲率 
函数 为 

1 
下 (10-37) 

函数 天 (P) 是 周期 为 尸 的 周期 函数 。 

定义 单位 边界 长 度 的 平均 能 量 ， 





象 特 征 的 描述 


2 人 Ko dp (10-38) 
在 面积 相同 的 条 件 下 ， 圆 具有 最 小 边界 能 量 为 =(2r/P) =(VR) ， 其 中 尺 为 圆 的 半 
径 。 边 界 能 量 更 符合 人 感觉 上 对 边界 复杂 性 的 理解 。 
(3) 圆 形 性 
圆 形 性 〈Circularity) C 是 一 个 用 区 域 R 的 所 有 边界 点 定义 的 特征 量 ， 即 


c= 全 (10-39) 
式 中 ，A 为 区 域 重 心 到 边界 点 的 平均 距离 ;， 6x 为 区 域 重心 到 边界 点 的 距离 方 均 差 。 两 者 的 
值 分 别 为 


和 = 工 |)- 开 列 (10-40) 
大气 
1 扎 上 
Ex = 元 志 [lewoo0)-G.-A] (10-41) 


当 区 域 R 趋向 圆 形 时 ， 特 征 量 C 是 单调 递增 且 趋 向 无 穷 的 ， 它 不 受 区 域 平 移 、 旋 转 和 
尺度 变化 的 影响 ， 可 以 推广 用 于 描述 三 维 目标 。 

(4) 面积 与 平均 距离 平方 的 比值 

图 形 度 的 第 4 个 指标 利用 了 边界 上 的 点 到 物体 内 部 某 点 的 平均 距离 4 ， 即 


坪 开 志 
(10-42) 


式 中 ，z 为 具有 N 个 点 的 物体 中 的 第 ;个 点 到 与 其 最 近 的 边界 点 的 距离 。 
相应 的 形状 度量 为 


人 4 N3 
RE (10-43) 
2 ] 
气 


5 球状 性 
球状 性 〈Sphericity) S 既 可 以 描述 二 维 目标 也 可 以 描述 三 维 目标 ， 其 定义 为 
厂 
S= 工 (10-44) 


六 


在 二 维 情况 下 ， 六 代表 区 域内 切 圆 的 半径 ， 而 六 代表 区 域外 接 圆 的 半径 ， 两 个 圆 的 圆心 


都 在 区 域 的 重心 上 ， 如 图 10-13 所 示 。 


图 10-12 ”曲率 半径 图 10-13 ”球状 性 定义 示意 图 





形状 描述 的 MATLAB 





形状 描述 的 MATLAB 实现 1， 程 序 代 码 如 下 : 





哆 计算 经 发 运算 后 图 像 面 积 的 改变 
BW=imread(circbw:tif); 
subplot(1.2,1),imshow(BW); 

% 图 像 的 膨胀 

SE=ones(5); 

BWIi=imdilate(BW,SE); 
subplot(1.2,2),imshow(BW1); 
zengjia=(bwarea(BW1)-bwarea(BW))bwarea(BW) 





运行 结果 如 下 : 


zengjia = 
0.3456 


原始 图 像 及 膨胀 后 的 图 像 如 图 10-14 所 示 。 











而 当 区 域 为 其 他 形状 时 ， 则 有 S<1.0。S 





图 10-14 图 像 面 积 改 变 的 应 用 
a 原始 图 像 b) 月 胀 后 的 图 像 





现 2， 程 序 代 码 如 下 : 


% 求 矩阵 4 的 面积 和 质心 坐标 

A=[01110110; 
01111110; 
01110000; 
了 人 
LEDHELT 
11111000; 
01111110; 
00011111 

regionprops(A,Area) 





regionprops(AvCentroid) 


程序 运行 结果 如 下 : 


寺 征 的 描述 





0 1 1 1 0 1 1 0 
0 1 1 下 1 1 0 
0 1 1 1 0 0 0 0 
1 1 1 1 1 1 0 0 G) 
1 和 1 1 1 1 
1 1 1 1 示 0 0 0 
0 1 1 1 1 1 0 
0 0 0 1 1 1 1 1 
县 
Area: 44 
Centroid: [4.2500 4.5909] 
10.4 ”区域 描述 


对 一 幅 灰 度 图 像 或 者 彩色 图 像 运用 图 像 分 割 的 方法 进行 处 理 ， 把 其 中 感 兴趣 的 像素 分 离 
出 来 作为 目标 像素 ， 取 值 为 1， 而 把 不 感 兴趣 的 其 余部 分 作为 背景 像素 ， 取 值 为 0， 就 可 以 
得 到 一 幅 二 值 图 像 。 在 理想 情况 下 ， 希 望 该 二 值 图 像 中 的 两 个 值 准确 地 代表 目标 及 背景 。 但 
实际 中 ， 往 往 所 检测 到 的 目标 中 还 有 若干 个 “ 假 目标 ”出 现 ， 还 有 可 能 提取 的 是 多 个 目标 ， 
因此 ， 就 需要 对 二 值 图 像 进行 处 理 ， 实 现 对 目标 的 分 析 。 二 值 图 像 包 含 目标 的 位 置 、 形 状 、 
结构 等 很 多 重要 的 信息 ， 是 图 像 分 析 和 目标 识别 的 依据 。 本 节 将 围绕 二 值 图 像 处 理 的 方法 进 
行 阐述 。 


下 允 有 几何 特征 


1. 像素 与 领域 

二 值 图 像 中 的 像素 值 不 是 1， 就 是 0。 其 中 1 表示 目标 的 值 ，0 表示 背景 的 值 。 jx, 7 
表示 位 于 图 像 陈列 中 第 x 行 、 第 ” 列 的 像素 的 值 。 一 幅 记 xz 的 图 像 具 有 关 行 和 靖 列 ， 行 的 
标号 从 0 到 m-1， 列 的 编号 从 0 到 妹 -1。 这 样 ， /0.0) 表示 图 像 左 上 角 的 像素 值 ， 
(nm -12-1D 表示 图 像 右 下 角 的 像素 值 。 

在 许多 算法 中 ， 当 对 某 个 像素 进行 运算 时 ， 不 仅 要 用 到 该 像素 的 值 ， 也 要 用 到 它 邻 近 像 
素 的 值 。 关 于 领域 的 定义 ， 最 常见 的 有 两 种 ， 即 4- 领 域 (4-neighbor)》 和 8- 领 域 (8- 
neighbor)。 图 10-15 为 像素 (x, y) 的 4- 领 域 和 8- 领 域 示意 图 。 
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10-15 ”像素 (xy) 的 4- 领 域 和 8- 领 域 示意 图 


a) 4- 领 域 b) 8- 领 域 





2.， 区域 面 积 
- 值 图 像 中 目标 物 的 面积 4 就 是 目标 物 所 占 像素 点 的 数目 ， 即 区 域 的 边界 内 包含 的 像素 
点 数 。 目 标 物 面积 4 的 计算 公式 如 下 : 


OO 


RE (10-45) 


也 
对 二 值 图 像 而 言 ， 若 用 1 表示 目标 ， 用 0 表示 背景 ， 其 面积 就 是 统计 .F(x,y) =1 的 个 数 。 
3. 位 置 
由 于 目标 在 图 像 中 总 有 一 定 的 面积 大 小 ， 因 此 有 必要 定义 目标 在 图 像 中 的 精确 位 置 。 目 
标的 位 置 有 形 心 、 质 心 之 分 ， 形 心 为 目标 形状 的 中 心 ， 质 心 为 目标 质量 的 中 心 。 
对 六 x 呈 大 小 的 目标 ， 其 灰 度 值 为 /Ce ) ， 质 心 ( 飞 , 忆 ) 为 


| 


的 1 总 
击 儿 名 帮 s0 了 = 而 名 名 2 (10-46) 
形 心 为 
本 1 起 思 
ZX= 一 - = 一 (10-47) 
击 各 名 5 了 击 包 名 
4 区域 周 长 


数字 图 像 子 集 8 周 长 的 定义 有 不 同 概念 ， 通 常用 下 面 三 种 定义 来 近似 : 

@ 若 将 图 像 中 每 个 像素 都 看 做 是 单位 面积 的 小 方 格 ， 则 区 域 和 背景 都 由 方 格 组 成 ， 区 
域 的 周 长 可 以 定义 成 区 域 和 背景 交界 线 〈 接 缝 ) 的 长 度 。 

回 将 像素 看 做 一 个 个 的 点 ， 则 区 域 周 长 可 以 定义 为 区 域 边界 8 方向 链 码 的 长 度 。 

图 区 域 周 长 用 边界 所 占 面 积 表示 ， 也 即 边界 点 数 和 。 

5. 方向 

计算 物体 的 方向 比 计算 它 的 位 置 稍微 复杂 一 点 。 某 些 形状 〈 如 圆 ) 的 方向 不 是 唯一 的 ， 
为 了 定义 唯一 的 方向 ， 一 般 假 定 物体 是 长 形 的 ， 其 长 轴 方 向 被 定义 为 物体 的 方向 。 

图 像 中 物体 的 二 阶 矩 轴 是 这 样 一 条 线 : 物体 上 的 全 部 点 到 该 线 的 距离 的 平方 和 最 小 。 给 
出 一 幅 二 值 图 像 f(x,y) ， 计 算 物 体 点 到 直线 的 最 小 二 乘 方 拟 合 ， 使 所 有 物体 点 到 直线 的 距 
离 的 平方 和 最 小 ， 即 








| 
0 (10-48) 
所 纪 
式 中 ， 心 是 物体 点 (xD) 到 直线 的 距离 。 
6. 距离 
图 像 中 两 点 PCe7) 和 @wv) 之 间 的 距离 是 重要 的 几何 特性 ， 常 用 以 下 3 种 方法 测量 : 
1) 欧 几 里 德 距离 (Euclidean)。 


人 和 CPO=JG-D HOW (10-49) 
2) 4- 领 域 距离 〈City-block 城区 距离 )。 
d(P,O)=|z- 咱 +- (10-50) 


3) 8- 领 域 距 离 〈Chessboard 棋盘 距离 )。 


图 像 特 征 的 描述 





(P,O)=max(z- 才 +|- 趾 (10-51) 





由 于 图 像 区 域 的 某 些 矩 对 于 平移 、 旋 转 、 尺 度 等 几何 变换 具有 一 些 不 变 的 特性 ， 因 此 ， 人 
德 的 表示 方法 在 物体 分 类 与 识别 方面 具有 重要 的 意义 。 

1. 和 矩 的 定义 

对 于 二 维 连续 函数 /zy) ，(7+ 刘 阶 矩 定义 为 

mn = 低 三 werep)drdty PE=012… 六 约束 数 (10-52) 

由 于 /和 大 可取 所 有 的 非 负 整数 值 ， 因 此 ， 形 成 了 一 个 矩 的 无 限 集 。 而 且 ， 这 个 集合 完 
全 可 以 确定 函数 /(x,y) 本 身 。 也 就 是 说 集合 fmx} 对 于 函数 fgx,y) 是 唯一 的 ， 也 只 
(xy) 才 具 有 这 种 特定 的 矩 集 。 

为 了 描述 物体 的 形状 ， 假 设 fx y) 的 目标 物体 取 值 为 1， 背 景 为 0， 即 函数 只 反映 了 物 
体 的 形状 而 忽略 其 内 部 的 灰 度 级 细节 。 

参数 翔 k 称 为 矩 的 阶 。 零 阶 矩 是 物体 的 面积 ， 即 


mo= 六 三 7eomaudy (10-53) 


当 广 1， 有 0 时 ，mmo 对 二 值 图 像 来 讲 就 是 物体 上 所 有 点 的 x 坐标 的 总 和 。 同 理 ，m, 就 
是 物体 上 所 有 点 的 y 坐标 的 总 和 ， 令 








xz- 7= Zu (10-54) 
Too 7o00 
则 (z, 习 就 是 二 值 图 像 中 一 个 物体 的 质心 的 坐标 。 
中 心 矩 定义 为 
欠 = 三 三 -ao-m7eonardy (10-55) 
如 果 (zx, 习 是 数字 图 像 ， 由 式 〈10-55) 变 为 
人 = 可 0- 妃 f7oy (10-56) 
2. 不 变 矩 
定义 归 一 化 的 中 心 矩 为 
ES 国民 放 s 上 
/7 zx 人 二 可 (10-57) 
利用 归 一 化 的 中 心 德 ， 可 以 获得 对 平移 、 缩 放 、 镜 像 和 旋转 都 不 敏感 的 7 个 不 变 矩 ， 定 
义 如 下 : 
多 =7o+7a (10-58) 
多 =(Cjo ++7o 刀 十 47 《10-59) 
山 =(ho +372 帮 二 (371 一 70 (10-60) 
= Cjo 十 力 二 (Oil 十 7 5C10-61) 


铬 = (Co 一 37a JP 十 7 )[(C7ao 十 思 3) 一 3(72; 二 73)] + 





GmP 一 7JCDai +7) [307ho +7 守 一 OP +7oD 7] (10-62) 


网 =(7o 一 Te][C7o 十 7 六 一 OPi +7os7]+470iC7o 十 7a)CDPi 二 73) 《10-63) 
g = (37a 一 To)C7o 十 妨 2)[(775o 士 力 有 一 30Pi 十 To)] 二 
G7P 一 7)GOPi +7)E3Cho +7 一 Oo 一 7 (10-64) 


下 面 为 对 一 幅 图 像 ， 分 别 对 其 进行 着 时 针 旋转 35、 垂直 镜像 、 尺 度 缩小 为 原始 图 像 的 一 
半 ， 分 别 求 出 原始 图 像 及 变换 后 的 各 个 图 像 的 七 阶 矩 ， 可 以 得 出 这 7 个 矩 的 值 对 于 旋转 、 镜 


像 及 尺度 变换 不 敏感 ， 程 序 代码 如 下 ， 


clear all 
=imread(pouttif); 

TH=T 

imshow(ll 入 
ID=imrotate(L5vbilinear); 
figureimshow(l2); 
BG=fliplr(D; 
figureimshow(I3) 
14=imresize(L0.5vbilinear); 
figure,imshow(l4); 
display( 原 始 图 像 ); 
qijieju(tT); 
dispaly( 旋 转变 化 ) 
qijieju(I2) 

dispaly( 镜像 变 化 ) 
qijieju(l3); 

dispaly( 尺 度 变化 ) 





function qijieju(I0) 
A=double(I0); 
[ncunrj=size(A); 
[cyl=meshgrid(l:nnl:ncj; 





ml10=sum(x.*A); 
m01=sum(y.*A); 
xmean=m10/m00; 
yean=m01/m00; 
cm00=m00; 





cm02=(sum((y-ymean).^2.*A))m00^2); 


cm03=(sum((y-ymean).^3.*A))X(m00^2.5); 








cmll=(sum((x-ymean).*(y-ymean).*A))Xm00^2); 
cml12=(sum((x-ymean).*(y-ymean).^2.*A))(m00^2.5); 
cm20=(sum((x-xmean).^2.*A))m00^2); 
cm21=(sum((x-xmean).^2.*(y-ymean).*A))M(m00^2.5); 
cm30=(sum((x-xmean).^3.*A))m00^2.5); 
ju(D)=cm20+cm02; 

juC)=(cm20-cm02)^2+4*cml1^2; 
juG3)=(cm30-3*cm12)^2+(3*cm21-cm03)"2; 
ju(4)=(cm30+cm12)"2(cm21+cm03)/2; 
ju(5)-(cm30-3*cm12)*(cm30+cm12)*((cm30tcem12)^2-3*(cm21+cm03)^2)+(G3*cm21- 
cm03)*(cm21+cm03)*(3*(cm30+cm12)"2-(cm21+cm03)^2); 


包 


ju(6)=(cm20-cm02)*((cm30+cml2)^2-(cm21+cm03)“2)+4*cm1l1y(cm30+cm12)*(cm21+cm03); 


ju(7)=(G3*cm21-cm03)*(cm30+cml2)*((cm30+cm12)^2-3*(cm21+cm03)^2)+(3*cm12- 
cm30)*(cm21+cm03)*(3*(cm30+cm12)^2-2(cm21+cm03)^2); 
qijieju=abs(logGu)) 


程序 运行 结果 如 下 : 





原始 图 像 

qijieju= 6.5235 ”16.3199 ”25.7319 ”24.5010 。” 50.4446 。 32.6666 。 49.8227 
旋转 变化 

qijieju= 6.5235 ”16.3198 ”25.7314 ”24.5009 ”50.4437 ”32.6664 。 49.8224 
镜像 变化 

qijieju= 6.5235 16.3199 ”25.7319 ”24.5010 ”50.4446 ”32.6666 。 49.8227 
尺度 变化 

qijieju = 6.5239 16.3550 ”25.7595 ”24.4960 ”50.4555 。 32.6799 。 49.8278 


原始 图 像 及 变化 后 的 图 像 如 图 10-16 所 示 。 


司 日 曲 


图 10-16 “不 变 矩 应 用 举例 





a 原始 图 像 b) 逆 时 针 旋转 $" 后 的 图 像 e) 垂直 镜像 后 的 图 像 d) 尺度 缩小 的 图 像 





由 


过 如 和 
下 人 
区 力 国 国 昌 罗 四 多 





10.5 “形态 分 析 


数学 形态 学 〔(Mathematics Morphology) 形成 于 1964 年 ， 法 国 巴 黎 矿 业 学 院 马 瑟 荣 
〈G. Matheron) 和 他 的 学 生 赛 拉 〈J. Serra) 在 从 事 铁 矿 核 的 定量 岩石 学 分 析 中 提出 了 该 
理论 。 数 学 形态 学 是 在 集合 代数 的 基础 上 通过 物体 和 结构 元 素 相互 作用 的 某 些 运算 得 到 
物体 更 本 质 的 形态 〈Shape) 的 ， 是 用 集合 论 方法 定量 描述 目标 几何 结构 的 学 科 ， 其 基本 
思想 和 方法 对 图 像 处 理 的 理论 和 技术 产生 了 重大 的 影响 ， 已 成 为 数字 图 像 处 理 的 一 个 主 
要 研究 领域 ， 在 文字 识别 、 显 微 图 像 分析 、 医 学 图 像 、 工 业 检测 、 机 器 人 视觉 等 方面 都 
有 很 成 功 的 应 用 。 
用 数学 形态 学 处 理 二 值 图 像 时 ， 要 设计 一 种 搜集 图 像 信息 的 “ 探 针 ”， 称 为 结构 元 素 。 
结构 元 素 通常 是 一 些小 的 简单 集合 ， 如 图 形 、 正 方形 等 的 集合 。 如 图 10-17 所 示 ， 观 察 者 在 
图 像 中 不 断 地 移动 结构 元 素 ， 看 是 否 能 将 这 个 结构 元 素 很 好 地 填 放 在 图 像 的 内 部 ， 同 时 验证 
填 放 结构 元 素 的 方法 是 否 有 效 ， 并 对 图 像 内 适合 放 入 结构 元 素 的 位 置 做 标记 ， 从 而 得 到 关于 
图 像 结构 的 信息 。 这 些 信息 与 结构 元 素 的 尺寸 和 形状 都 有 关 。 构 造 不 同 的 结构 元 素 〈 如 方形 
或 圆 形 结构 元 素 )， 便 可 完成 不 同 的 图 像 分 析 ， 从 而 得 到 不 同 的 分 析 结 果 。 
用 形态 学 的 方法 处 理 和 分 析 图 像 即 是 对 物体 或 目标 的 形态 分 析 ， 本 节 主要 介绍 二 值 形 
态 分 析 方法 中 最 基本 的 几 种 运算 ， 即 腐蚀 、 巾 胀 以 及 由 它们 组 合 得 到 的 开 闭 运算 和 边界 检 














测算 法 。 
1. 腐蚀 
将 一 个 集合 4 平移 距离 b， 可 以 表示 为 4+b， 其 定义 为 


4+b={a+blas 才 (10-65) 
图 10-18 说 明了 集合 平移 的 过 程 ， 从 几何 上 看 ，4+2 表 示 4 沿 矢量 访 平 移 了 一 段 距 
离 。 探 测 的 目的 ， 就 是 要 标记 出 图 像 内 部 那些 可 以 将 结构 元 素 填 入 的 《〈 平 移 ) 位 置 。 








图 10-17 形态 学 基本 运算 图 10-18 二 值 图 像 的 平移 
集合 4 被 刀 腐 蚀 ， 表 示 为 498 ， 其 定义 为 
49B={[a:B+acC 少 〈10-66) 


式 中 ，4 为 输入 图 像 ， 为 结构 元 素 。 
49B 由 将 妃 平 移 消 仍 包含 在 4 内 的 所 有 点 疾 组 成 。 如 果 将 巨 看 做 模板 ， 那 么 498 则 由 
在 模板 平移 的 过 程 中 ， 所 有 可 以 填 入 4 内 部 的 模板 的 原点 组 成 ， 如 图 10-19 所 示 。 








图 10-19 认 蚀 类 似 于 收缩 


从 图 10-19 中 可 以 看 出 腐蚀 是 表示 用 某 种 “ 控 针 ”( 即 结构 元 素 ) 对 一 个 图 像 进行 探 
测 ， 以 便 找 出 图 像 内 部 可 以 放下 该 结构 元 素 的 区 域 。 它 是 一 种 消除 边界 点 ， 使 边界 向 内 部 收 
缩 的 过 程 。 可 以 用 来 消除 小 且 无 意义 的 物体 。 一 般 而 言 ， 如 果 原 点 在 结构 元 素 的 内 部 ， 则 腐 
蚀 后 的 图 像 为 输入 图 像 的 子 集 ， 如 果 原点 不 在 结构 元 素 的 内 部 ， 则 腐蚀 后 的 图 像 可 能 不 在 输 
入 图 像 的 内 部 ， 但 输出 形状 不 变 ， 如 图 10-20 所 示 。 





图 10-20 腐蚀 不 是 输入 图 像 的 子 图 像 
如 用 0 代表 背景 ，!1 代表 目标 ， 设 数字 图 像 8 和 结构 元 素 已 为 


全 1 0 
可 中 五 =| 1 
天 二 


三 角形 “和 A” 代 表 坐 标 原点 ， 则 用 巨 对 8 腐蚀 的 结果 为 
0 0 
1 
1 





0 0 0 
SOFE = 0 0 0 
0 二 兴 








上 
2 膨胀 
设 有 一 幅 图 像 4， 将 4 中 所 有 元 素 相对 原点 转 180"， 即 令 (xm, 芒 ) 变 成 (-m,-)， 所 得 
到 的 新 集合 称 为 4 的 对 称 集 ， 记 为 -4 ， 如 图 10-21 所 示 。 





图 10-21 相对 原点 转 180? 











以 4 表示 集合 4 的 补 集 ，-B 表示 互 关于 坐标 原点 的 反射 〈 对 称 集 )。 那 么 ， 集 合 4 被 
巨 膨胀 ， 表 示 为 4@ 四 妃 ， 其 定义 为 
4 田 B=[4c@(-B)] (10-67) 
为 了 利用 结构 元 素 下 膨胀 集合 4， 可 将 妃 相对 原点 旋转 180"*， 得 到 -B， 再 利用 -B 对 
4 进行 腐蚀 ， 腐 蚀 结果 的 补 集 就 是 所 求 的 结果 ， 如 图 10-22 所 示 。 


本 y 4@B 
O 草 D 
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图 10-22 ”利用 圆 盘 膨胀 





以 下 程序 示例 说 明了 如 何 对 图 像 eight 进行 腐蚀 和 脱 胀 操作 ， 程 序 代码 如 下 : 


%% 创 建 结构 元 素 

SE=strel(rectangle',[40 30]); 

二 imread(eighttif; 

figure(l),imshow(D; 

% 使 用 结构 元 素 腐 蚀 图 像 

ID=imerode(LSE); 

figure(2),imshow(I2) 

呈 恢复 托 形 有 大 小 ， 使 用 相同 的 结构 元 素 对 腐蚀 过 的 图 像 进行 膨胀 
3=imdilate(l2.SE); 
figure(3),imshow(I3) 


执行 程序 代码 后 ， 效 果 如 图 10-23 所 示 。 











司 b 


图 10-23 ” 脱 胀 、 腐 蚀 综合 操作 的 显示 效果 
a) 原始 图 像 b) 腐蚀 图 像 “) 膨胀 图 像 
膨胀 的 等 效 方程 ;膨胀 还 可 以 通过 相对 结构 元 素 的 所 有 点 平移 输入 图 像 ， 然 后 计算 并 集 
得 到 ， 可 用 如 下 表达 式 描述 : 
4@B=UL4+DIDEB} 《10-68) 
式 〈10-68) 也 称 为 明 夫 斯 基 和 形式 。 图 10-24 是 用 式 〈10-68) 肛 胀 的 示意 图 ， 





8 








图 10-24a 为 输入 图 像 ， 图 10-24b 为 结构 元 素 ， 将 输入 图 像 相对 于 结构 元 素 内 的 3 个 点 进行 
平移 ， 并 将 3 个 平移 图 像 三 加 ， 最 后 的 输出 图 像 如 图 10-24c 所 示 ， 图 10-24c 中 3 种 不 同 外 
框 标 出 的 点 对 应 了 输入 图 像 的 3 次 平移 。 


? 











刘 



































O 
O 洒 四 


图 10-24 用 式 〈10-68) 膨胀 的 示意 图 


al) 输入 图 像 b) 结构 元 素 “) 月 胀 结果 





3， 开 运算 
假定 4 仍 为 输入 图 像 ，B 为 结构 元 素 ， 利 用 妃 对 4 作 开 运 算 ， 用 4。 中 表示 ， 其 定义 为 
4oB=(49B) 四 下 《10-69) 
所 以 ， 开 运算 实际 上 是 4 先 被 B 腐蚀 ， 然 后 再 被 有 膨胀 的 结果 。 开 运算 通常 用 来 消除 小 
象 物 、 在 纤细 点 处 分 离 物体 、 平 滑 较 大 物体 边界 的 同时 并 不 明显 改变 其 面积 。 图 10-25 是 用 
盘 对 托 形 进行 开 运 算 的 例子 。 


池 

















图 10-25 用 圆 盘 对 输入 图 像 开 运算 的 结果 


从 图 10-25 可 以 看 到 ， 开 运算 具有 两 个 显著 的 作用 : @D 利 用 圆 盘 可 以 磨 光 矩形 内 边缘 ， 
即 可 以 使 图 像 的 尖 角 转化 为 背景 。@ 用 4- 4。B8 可 以 得 到 图 像 的 尖 角 ， 因 此 圆 盘 的 圆 化 作用 
可 以 起 到 低 通 滤波 的 作用 。 

开 运算 在 粘连 目标 的 分 离 及 背景 噪声 〈 椒 盐 噪 声 ) 的 去 除 方面 有 较 好 的 效果 。 

4. 闭 运算 

闭 运算 是 开 运算 的 对 偶 运算 ， 定 义 为 先进 行 膨 胀 然后 再 进行 腐蚀 。 利 用 中 对 4 进行 闭 
运算 ， 用 4.B 表 示 ， 其 定义 为 

4 有 B=[4 田 (-B)]O(-B) 《10-70) 

即 用 -B 对 4 进行 膨胀 ， 将 其 结果 再 用 -B 进行 腐蚀 ， 闭 运算 通常 用 来 填充 目标 内 细 
小 孔洞 、 连 接 断 开 的 邻近 目标 、 平 滑 其 边界 的 同时 并 不 明显 改变 其 面积 。 图 10-26 描述 
了 闭 运算 的 过 程 及 结果 。 显 然 ， 用 闭 运算 对 图 形 的 外 部 进行 滤波 ， 仅 仅 磨 光 了 凸 向 图 像 
内 部 的 边 角 。 

闭 运算 在 去 除 图 像 前 景 噪声 〈 砂 眼 噪声 ) 方面 有 较 好 的 应 用 。 





00 这 











4@(- 有 ) 
图 10-26 利用 圆 极 对 输入 图 





了 闭 运 算 


以 下 是 利用 MATLAB 实现 二 值 图 像 开 运算 和 闭 运 算 的 程序 代码 ， 


clear all; 
bw0=imread(F:\imagevabmp) 
figure(D),imshow(bwO) 

% 变 为 阔 值 取 为 0.7 的 二 值 图 像 
bwl=im2bw(bw0,0.7); 
figure(2),imshow(bw1); 





S=ones(3); 
bw2=imopen(bw1.s); 
figure(3),imshow(bw2); 
bw3=imclose(bwl,s); 
figure(4),imshow(bw3); 
S]1=strel(disk',2); 
bw4=imopen(bwl,s1); 
figure(5),imshow(bw4): 
bws=imclose(bwl,s1); 
figure(6)imshow(bw5) 





程序 执行 后 ， 结 果 如 图 10-27 所 示 。 图 10-27c 是 用 三 阶 
， 图 10-27d 是 用 三 阶 人 阵 的 结构 元 素 进行 膨胀 的 结果 果 ， 
交合 进行 腐蚀 的 结果 





， 图 10-27f 是 用 半径 为 2 的 平 





由 上 
图 10-27 二 值 图 像 的 腐蚀 与 


a) 原始 图 像 b) 二 值 化 图 像 “) 腐蚀 后 的 图 像 1 d) 昌 图像 1 





图 10-27e 
坦 攻 





单位 矩阵 的 结构 元 素 ; 


且 
在 上 





尾 半 径 为 2 


结构 进行 膨胀 的 结果 





膨胀 


e 腐蚀 后 的 图 像 2 


人 





后 的 图 像 2 





窗 蚀 的 儿 
的 平 昌 





5. 边界 检测 

利用 圆 盘 结构 元 素 进行 膨胀 会 使 图 像 扩 大 ， 进 行 腐蚀 会 使 图 像 缩小 
用 来 检测 二 值 图 像 的 边界 。 对 于 图 像 4 和 圆 盘 B， 图 10-28 给 出 了 三 种 求 取 二 值 边界 的 方 
法 : 内 边界 、 有 作 实际 边缘 上 的 边界 。 其 中 跨 骑 丰 


上 的 边界 又 称 为 形态 人) 
学 梯度 。 图 10-29 是 用 腐蚀 和 膨胀 方法 得 到 的 实际 二 值 图 像 的 边 


中 + ad 中 


4-498 4 四 B-4 4 田 B-4GB 
图 10-28 用 腐蚀 和 脱 胀 运算 得 出 的 三 种 图 像 边界 
下 面 为 边界 提取 的 具体 代码 ， 效 果 如 图 10-29 所 示 。 


这 两 种 运算 都 可 以 













图 10-29 边界 提取 示例 


a 原始 图 像 划 边界 提取 效果 
imread(circbw-tif; 
imshow(D; 


I=bwperim(L8); % 获 取 区 域 的 边界 


figureimshow(I2) 
以 上 腐蚀 、 膨 胀 、 开 闭 运 算 以 及 边界 检测 等 都 是 二 值 形态 分 析 处 理 方法 中 的 基本 运 
算 ， 其 他 方法 如 细 化 、 骨 架 算法 等 也 都 是 比较 常用 的 二 值 形态 分 析 处 理 方法 ， 而 且 这 些 


算法 还 可 以 推广 到 一 般 的 灰 度 图 像 处 理 上 ， 限 于 篇 幅 ， 在 此 不 再 详细 讨论 ， 感 兴趣 的 读 
者 可 以 参阅 相关 资料 。 


10.6 区域、 对 象 及 特性 度量 








在 MATLAB 7.0 图 像 处 理工 具 箱 中 提供 了 专门 的 bwlabel0 函 数 ， 可 以 对 二 值 图 像 的 连接 








MATLABSR 











部 分 进行 标记 。 它 主要 对 二 值 图 像 中 各 个 分 离 部 分 进行 标记 。 用 户 指定 输入 图 像 和 特定 的 边 
缘 约 定 类 别 ，bwlabel0 函 数 将 返回 与 输入 图 像 大 小 相同 的 数据 矩阵 ， 这 样 就 可 以 利用 数据 矩 
阵 各 元 素 的 不 同 整数 值 来 区 分 图 像 中 的 不 同 物体 。 

假设 有 二 值 图 像 如 下 








BW= 
0 0 0 
0 1 1 
0 1 1 
0 1 0 
0 0 0 
0 0 0 
0 0 0 
0 0 0 

调用 bwlabel0 数 ， 同 

X=bwlabel(BW,4) 

X 
0 0 0 0 0 0 0 0 
0 1 1 0 0 3 3 3 
0 1 1 0 0 0 3 
0 1 1 0 0 0 0 0 
0 0 0 2 2 0 0 0 
0 0 0 2 2 0 0 0 
0 0 0 2 2 0 0 0 


在 X 中 ，! 代表 第 1 个 对 象 ，2 代表 第 2 个 对 象 ;， 3 代表 第 3 个 对 象 。 如 果 采 用 8- 领 域 
连接 方式 ， 则 4- 领 域 中 的 对 象 1 和 对 象 2 将 合并 为 一 个 对 象 ， 这 样 就 只 能 得 到 两 个 对 象 。 

由 于 bwlabel0 函 数 的 输出 矩阵 不 是 二 值 图 像 ， 而 是 double 2 型 的 矩阵 ， 因 此 可 以 计 
引 色 图 像 的 格式 显示 该 输出 矩阵 。 在 显示 时 ， 首 先 将 各 元 素 加 1， 使 各 个 人 二 机 于 
图 像 有 效 的 像素 值 范围 中 。 这 样 ， 就 可 以 将 每 个 物体 显示 为 不 站 的 颜色 ， 很 容易 将 各 个 物体 
区 分 开 来 。 例 如 ， 执 行 以 下 程序 代码 ， 结果 如 图 10-30 所 示 。 


The term watershed 
refers to aridge that … 
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司 划 
图 10-30 将 图 像 中 不 同 的 物体 表示 为 不 同 的 颜色 
al 原始 图 像 b) 显示 效果 图 像 








昌 [UEI 人 图像 特征 的 描述 


BWI1=imread(textpng); 
figureiimshow(BW1); 
X=bwlabel(BW1,4): 


训 





在 二 值 图 像 中 ， 所 谓 对 象 就 是 指 像素 值 为 1， 且 连接 在 一 起 的 所 有 像素 的 集合 。 当 只 需 
要 图 像 中 特定 的 对 象 时 ， 可 使 用 对 象 操作 选择 想 要 的 对 象 。 在 MATLAB 7.0 图 像 处 理工 具 箱 
中 提供 了 专门 的 bwselectO 函 数 ， 用 于 在 二 值 图 像 中 选择 特定 的 对 象 。 在 进行 对 象 选择 时 ， 
首先 需要 指定 一 些 像素 ， 然 后 bwselect0 函 数 才 会 返回 包含 指定 像素 的 二 值 图 

利用 bwselect0 函 数 ， 可 以 实现 某 些 特征 提取 ， 如 提取 文本 图 像 中 的 某 些 
下 程序 代码 就 是 对 如 图 10-31a 所 示 的 二 进 制 文本 图 像 提取 其 中 的 某 些 字 符 ， 其 操作 结果 如 
图 10-31b 所 示 。 
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图 10-31 提取 文本 图 像 中 字母 的 操 





a 原始 图 像 b) 选 





显示 字母 图 像 


BW1=imread('textpng'); 
figurejimshow(BW1); 

c=[10 16 54]; 

107 117]; %r、e 指定 了 图 像 中 T 
Wselect(BW1,cr4); 
figure,imshow(BW2) 


在 进行 图 像 处 理 时 ， 有 时 会 希望 获取 图 像 中 改变 某 些 特 性 的 信息 。 例 如 ， 在 进行 膨胀 操 
作 时 ， 我 们 希望 知道 有 多 少 像素 的 值 由 0 变 为 1， 或 者 想 知 道 图 像 中 对 象 的 数目 是 否 改变 。 
对 此 可 用 bwarea0 函 数 和 bweuler() 函 数 对 图 像 特征 进行 提取 操 下 面 分 别 介绍 。 

在 MATLAB 7.0 图 像 处 理工 具 箱 中 提供 了 专门 的 bwarea() 函 数 ， 可 以 用 来 获得 二 值 图 像 
的 面积 。 这 里 的 面积 可 以 简单 理解 为 图 像 前 景 中 像素 值 为 1 的 像素 数量 















i 亦 。 














当然 ，bwarea0 函 数 并 非 简单 地 计算 像素 值 为 1 的 像 数 数目 ， 它 还 对 不 同 的 像素 赋予 不 
同 的 权 值 ， 以 补偿 由 于 用 离散 图 像 表 示 连 续 图 像 所 引起 的 误差 。 例 如 ， 一 条 50 点 长 的 对 角 
线 要 比 50 点 长 的 水 平 线 长 。 正 是 这 个 原因 ，bwarea(0) 函 数 对 50 点 长 的 水 平 线 返回 的 面积 为 
50， 而 对 50 点 长 的 对 角 线 返回 的 面积 则 是 62.5。 

以 下 程序 代码 示例 将 计算 电路 图 〈circbw:tif) 经 过 膨胀 运算 后 图 像 面积 的 改变 量 ， 如 
图 10-32 所 示 ， 图 10-32a 为 膨胀 前 的 图 像 ， 图 10-32b 为 膨胀 后 的 图 像 ， 经 过 计算 ， 可 知 面 
积 增加 了 0.3456。 









图 10-32 ”二 值 图 像 膨 胀 运算 结果 
及 胀 前 的 图 像 b) 及 胀 后 的 图 像 


BW=imread(circbw:tif); 

figure,imshow(BW); 

figure; 

Se=ones(5); 

BW2=imdilate(BW',se); 

imshow(BW2); 
imcrease=(bwarea(BW2)-bwarea(BW))bwarea(BW); 


程序 运算 结果 ; 


imcrease = 
0.3456 


在 对 图 像 拓扑 进行 估计 时 ， 经 
像 中 的 对 象 数目 减 去 该 图 像 中 的 孔 
该 分 析 方法 是 一 种 非常 有 效 的 方法 。 

在 MATLAB 7.0 图 像 处 理工 具 箱 中 提供 了 专门 的 bweuler0 函 数 ， 用 于 计算 二 进 制图 像 
的 欧 拉 数 。 

利用 bweuler0) 函 数 进 行 欧 拉 数 计算 时 ， 该 函数 只 支持 4- 领 域 和 8- 领 域 两 种 连通 方式 。 
如 何 利用 bweuler0) 函 数 进行 欧 拉 数 计算 呢 ? 以 下 程序 代码 示例 说 了 该 函数 的 使 用 情况 ， 并 在 
8- 领 域 方式 下 ， 计 算 了 trees 图 像 〈 见 图 10-33) 的 欧 拉 数 。 


使 用 到 一 个 量 一 一 欧 拉 数 。 所 谓 欧 拉 数 ， 就 是 一 幅 图 
目 。 在 模式 识别 中 ， 经 常 利用 欧 拉 数 进行 聚 类 分 析 ， 


















clear all; 


BW=imread(' Fimagevtrees.tif); 
imshow(BW) 
s=bweuler(BW,8); 


程序 运算 结果 : 攻 


-100 


在 该 示例 中 ， 欧 拉 数 是 个 负数 ， 表 明 孔 洞 数 目 大 于 对 象 数目 。 
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在 本 节 ， 将 以 一 个 具体 示例 说 明 如 何 利用 MATLAB 7.0 图 像 工具 箱 中 提供 的 形态 学 处 理 
函数 ， 实 现 对 一 幅 图 像 进行 有 效 分 割 。 图 像 分 割 后 ， 该 图 像 中 相连 的 多 个 对 象 将 被 分 割 成 多 
个 单 对 象 。 为 此 ， 分 下 面 几 步 完成 。 

1. 读 取 图 像 

从 图 像 处 理工 具 箱 中 读 取 图 像 'fjpg'， 如 图 10-34 所 示 。 








TI=imread(Fximagevffjpg) 
figure, 


imshow(D); 





图 10-33 trees 图 像 图 10-34 ”原始 图 像 


从 图 10-34 可 知 ， 该 图 像 包 含 众多 不 同 大 小 的 、 紧 密 相连 的 对 象 。 为 了 有 效 分 割 开 这 些 
对 象 ， 可 用 分 水 岭 变 换 方 人 [将 图 像 看 成 一 个 凹 西 表面 ， 利 用 分 水 岭 
变换 ， 可 以 有 效 发 现 图 像 中 的 谷 点 。 

为 了 得 到 最 好 的 结果 ， 可 以 增强 图 像 中 感 兴趣 的 对 象 来 最 小 化 ， 通 过 分 水 岭 变换 图 
像 中 谷 点 的 个 数 。 而 对 于 对 比 度 增强 的 一 般 技术 是 联合 使 用 top_hat 变换 和 bottom_hat 
汪 






.创建 结构 元 素 
于 在 图 像 中 所 感 兴趣 的 对 象 像 一 个 磁盘 ， 所 以 该 示例 中 可 以 用 strel0 函 数 创 建 一 个 磁 
盘 结 构 元 素 ， 磁 盘 的 大 小 可 用 图 像 中 对 象 的 平均 半径 来 估计 。 





Se=strel(disk,13); 














3， 增强 图 像 对 比 度 
ImtophatO 函 数 和 imbothat(0) 函 数 可 以 分 别 返回 原 图 像 的 top-hat 变换 和 bottom-hat 变换 ， 
变换 效果 如 图 10-35 所 示 。 





图 10-35 增强 图 像 对 比 度 
atop-hat 变换 后 的 效果 “b) bottom-hat 变换 后 效果 


Fimread(Fximagevffjpg) 
se=strel(disk',15); 
top=imtophat([,se); 
bot-imbothat(L.se): 
figure,imshowftop,[]); 
figure,imshow(bot[]); 


4. 增 大 对 象 间 的 间隙 

由 图 10-36 可 知 ，top-hat 图 像 包含 了 匹配 结构 元 素 的 对 象 ， 但 对 象 间 比 较 间隙 较 
小 ， 需 要 增 大 对 象 间 的 间隙 。MATLAB 7.0 提供 了 imbothat(O) 函 数 ， 可 以 有 效 反 映 对 象 间 的 
间隙 。 为 了 增加 图 像 中 对 象 和 间隙 的 对 比 度 ， 在 该 示例 中 ， 首 先 将 top-hat 变换 所 得 到 的 图 
像 与 原始 图 像 相 加 ， 然 后 再 减 去 bottom-hat 变换 所 得 到 的 图 像 ， 就 可 以 有 效 地 增加 对 象 和 间 
隙 的 对 比 度 。 以 上 操作 由 以 下 程序 代码 实现 ， 处 理 效果 如 图 10-36 所 示 。 





Ienhance=imsubtract(imadd(top,D,bot); 
figure,imshow(Ienhance) 


5 感 兴趣 对 象 的 转换 
由 于 分 水 岭 变 换 可 以 有 效 检 ， 
照 亮 图 像 中 的 谷 点 ， 以 利于 有 效 检 





测 图 像 中 的 各 
吕 。 谷 点 增 





所 以 可 以 首先 用 imcomplement() 函 数 增强 





图 10-36 ”对象 间 的 间隙 增 大 效果 图 图 10-37 转 “ 趣 的 区 域 效果 图 





图 像 特征 的 描 





Tec=imcomplement(lenhance); 
figureiimshow(lec) 


6 检测 名 

在 增强 谷 点 之 后 ， 就 可 以 有 效 地 进行 检测 了 。 本 例 中 可 以 使 用 imextendedmin0) 函 数 
和 imimposemin() 函 数 来 检测 这 两 个 函数 的 具体 说 明 可 参考 图 像 处 理工 具 箱 ， 其 引用 
方法 如 下 ， 其 处 理 效 果 如 图 10-38 所 示 。 












图 10-38 ” 谷 点 检测 效果 图 


aimextendedmin 检测 效果 “b) imimposemin 检测 效果 


Iemin=imextendedmin(lec.22); 
Iemin=double(Iemin); % 转 化 为 二 进 制 图 像 
Timpose=imimposemin(lec,Iemin); 
figure,imshow(lemin); 
figureimshow(limpose) 


7 分水岭 变 换 

通过 上 面 的 处 理 步骤 ， 可 以 用 MATLAB 7.0 提供 的 watershedO 函 数 ， 使 
对 使 用 imimposemin() 函 数 进 行 谷 点 检测 后 的 图 像 Timpose 进行 分 水 岭 变换 卉 

Watershed() 函 数 将 返回 一 个 包含 非 负 元 素 的 标签 算 阵 ， 该 矩阵 与 分 水 岭 区 域 相 对 应 。 不 
在 分 水 岭 区 域 的 像素 的 像素 值 将 全 部 设置 为 0。 

如 果 需 要 很 好 地 可 视 化 标签 算 阵 ， 则 可 以 将 标 


上 


和 以 下 程序 代码 













签 矩阵 转 为 颜色 矩阵 。 利用 MATLAB 7.0 
矩阵 效果 如 图 10-39 所 示 。 
-Am 





提供 的 label2rgb0O 函 数 可 以 达到 这 一 目的 ， 可 视 化 标 





图 10-39 ”分水岭 变 换 后 的 效果 图 





汪 





I=imread(trees:tif) 

Se=strel(disk',15); 

top=imtophat(Lse); 

bot=imbothat(Lse); 
Jenhance=imsubtract(imadd(top,D),bot; 
Iec=imcomplement(lenhance); 


Iemin=imextendedmin(lec,22); 
Iemin=double(lemin); 
Timpose=imimposemin(lec.Iemin); 
wat=watershed(limpose); 
rgb=label2rgb(wat); 
figure,imshow(rgb) 


8.， 从 标签 矩阵 中 提取 特征 

当 需 要 提取 图 像 中 某 些 特定 的 特征 时 ， 可 以 直接 从 标签 矩阵 中 进行 提取 。MAILAB 7.0 
提供 的 regionprops() 函 数 可 以 从 标签 算 阵 中 进行 提取 特征 。 例 如 ， 本 例 中 需要 计算 两 个 观测 
量 〈 面 积 和 方向 )， 并 视 它 们 为 彼此 的 函数 ， 则 特征 提取 效果 如 图 10-40 所 示 。 


ostpaatiaaigaipsgaioaas 








图 10-40 ”标签 矩阵 中 提取 特征 效果 图 


执行 程序 代码 如 下 : 


stats=regionprops(wat'AreavOrientation'); 
area=[stats.Area]; 
orient=[stats.Orientation]; 
figure,plot(areaorient'by); 


习题 


10-1 图 像 都 有 哪些 特征 ? 简要 说 明 这 些 特 征 及 其 在 图 像 分 析 中 的 用 途 。 
10-2 ”数字 图 像 处 理 技术 中 ， 计 算 区 域 面积 有 几 种 方法 ? 
10-3 ”什么 是 纹理 分 析 中 的 统计 法 ? 它 有 何 特点 ? 












本 全 
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直 
图 10-41 图 10-42 

10-5 计算 如 图 10-42 所 示 图 像 中 目标 《阴影 部 分 ) 的 面积 、 质 心 、 周 长 、 圆 形 度 、 矩 
形 度 以 及 长 宽 比 。 

10-6 ”分别 用 方形 和 圆 形 两 种 结构 元 素 实现 二 值 图 像 的 腐蚀 运算 ， 改 变 结构 元 素 的 大 
小 ， 观 察 并 分 析 腐蚀 结果 。 

10-7 ”编程 求 二 值 图 像 的 形态 边界 。 




















第 11 章 MATLAB 图 像 处 理 的 应 用 


11.1 MATLAB 在 遥感 图 像 处 理 中 的 应 用 


遥感 利用 融 感 器 从 空中 来 探测 地 面 物体 的 性 质 ， 它 根据 不 同 物体 对 滤 谱 产 人 
原理 ， 识 别 地 面 上 各 类 地 物 ， 并 经 记录 、 传 送 、 分 析 和 判读 来 识别 地 物 。 本 节 主 要 介绍 
MATLAB 遥感 图 像 处 理 简 介 、 遥 感 图 像 增 强 、 图 像 融合 、 变 换 检测 等 人 通 
过 本 章 的 学 习 ， 我 们 应 该 对 遥感 有 个 大 体 的 了 解 ， 掌 握 一 些 基本 的 遥感 图 像 处 理 方法 。 
[Laes7 1 

于 感 作为 一 门 对 地 观测 综合 性 技术 ， 它 的 出 现 和 发 展 既是 人 们 认识 和 探索 自然 界 的 客观 
需要 ， 更 有 其 他 技术 手段 与 之 无 法 比拟 的 特点 。 从 字面 上 说 ， 遥 感 就 是 从 远 处 感觉 事物 ， 严 
格 的 定义 是 远 远 地 去 感觉 某 一 定 对 象 的 技术 ， 而 广义 地 讲 ， 遥 感 是 不 直接 接触 地 收集 关于 某 

- 定 对 象 的 某 种 或 某 些 特定 ， 从 而 了 解 这 个 对 象 的 性 质 。 遥 感 技术 的 特点 归结 起 来 主 
要 有 以 下 三 个 方面 。 













宇宙 空间 对 大 范围 地 区 进行 观测 ， 并 从 中 获取 

有 价值 的 遥感 数据 。 这 些 数据 拓展 了 人 们 的 视觉 空间 ， 为 宏观 地 掌握 地 面 事物 的 现状 创造 了 
极为 有 利 的 条 件 ， 同 时 也 为 宏观 地 研究 自然 现象 和 规律 提供 了 宝贵 的 第 一 手 资料 。 这 种 先进 
的 技术 手段 与 传统 的 手工 业 相 比 是 不 可 替代 的 。 

(2) 能 动态 反映 地 面 事物 的 变化 

融 感 探测 能 周期 性 、 重 复 地 对 同一 地 区 进行 对 地 观测 ， 这 有 助 于 人 们 通过 所 获取 的 遥感 
数据 ， 发 现 并 动态 地 跟踪 地 球 上 许多 事物 的 变化 。 同 时 ， 研 究 自然 界 的 变化 规律 。 尤 其 是 在 
监视 天 气 状 况 、 自 然 灾 害 、 环 境 污染 甚至 军事 目标 等 方面 ， 遥 感 的 运用 显得 格外 重要 。 

(3) 获取 的 数据 具有 综合 性 

融 感 探测 所 获取 的 是 同一 时 段 、 覆 盖 大 范围 地 区 的 遥感 数据 ， 这 些 数据 综合 地 展现 了 地 
球 上 许多 自然 与 人 文 现象 ， 宏 观 地 反映 了 地 球 上 各 种 事物 的 形态 与 分 布 ， 真 实地 体现 了 地 
质 、 地 貌 、 土 壤 、 植 被 、 水 文 、 人 工 构筑 物 等 地 物 的 特征 ， 全 面 地 提示 了 地 理事 物 之 间 的 关 
联 性 ， 并 且 这 些 数据 在 时 间 上 具有 相同 的 现势 性 。 

现在 ， 世 界 各 国都 在 利用 陆地 卫星 所 获取 的 图 像 进行 资源 调查 〈 如 森林 调查 、 海 洋 泥 沙 
和 渔业 调查 、 水 资源 调查 等 )， 灾 害 检测 〈 如 病虫害 检测 、 水 火 检 测 、 环 境 污染 检测 等 )， 资 
源 勘 察 (如 石油 勘查 、 矿 产量 探测 、 大 型 工程 地 理 位 置 勘探 分 析 等 )， 农 业 规划 《〈 如 土壤 营 
养 、 水 分 和 农作物 生长 、 产 量 的 估算 等 )， 城 市 规划 〈 如 地 质 结构 、 水 源 及 环境 分 析 等 )。 我 
国 也 陆续 开展 了 以 上 各 方面 的 一 些 实际 应 用 ， 并 获得 了 良好 的 效果 。 在 气象 预报 和 对 太空 其 








MATLAB 图 像 处 理 的 应 用 





他 星球 研究 方面 ， 数 字 图 像 处 理 技术 也 发 挥 了 相当 大 的 作用 。 

MATILAB 作为 一 个 灵活 实用 的 编程 软件 ， 早 已 渗透 到 遥感 图 像 的 处 理 中 。 利 用 
MATILAB 可 以 对 遥感 图 像 进 行 图 像 增强 、 滤 波 、 灰 度 变 换 、 图 像 融合 、 统 计 分 析 等 ， 可 以 
大 大 推动 对 遥感 图 像 处 理 的 深入 研究 和 广泛 应 用 。 

MATLAB 在 遥感 图 像 中 的 应 用 主要 包括 以 下 几 个 方面 。 

1) 军事 侦察 定位、 引导、 指挥 等 。 

2) 多 光谱 卫星 图 像 分 析 。 

3) 地 形 、 地 图 、 国 土 普查 。 

4) 地 质 、 矿 藏 勘探 。 

5) 森林 资源 探查 、 分 类 、 防 火 。 

6) 水 利 资源 探查 ， 洪 水 泛滥 检测 。 

7) 海洋 、 渔 业 方 面 ， 如 温度 、 鱼 群 的 检测 、 预 报 。 

8) 农业 方面 ， 如 谷物 估 产 、 病 虫害 调查 。 

9) 自然 灾害 、 环 境 污染 的 检测 。 

10) 气象 、 天 气 预报 图 的 合成 分 析 预 报 。 

11) 天 文 、 天 空 星体 的 探测 及 分 析 。 

12) 交通 、 空 中 管理 、 铁 路 选 线 等 。 


12 | 利用 MATLAB 对 遥感 图 像 进行 直方 图 匹配 | 


遥感 系统 记录 地 球 表面 物质 的 反射 和 发 射 辐射 通 量 。 理 想 情 况 下 ， 某 种 物质 的 特定 波长 
会 反射 大 量 的 能 量 ， 而 另 一 种 物质 在 同样 的 波长 下 反射 的 能 量 可 能 要 小 得 多 。 这 使 得 遥感 系 
统 记 录 的 两 种 地 物 之 间 存 在 对 比 度 。 然 而 ， 不 同 地 物 经 常 对 可 见 光 、 近 红外 和 中 红外 反射 相 
似 的 辐射 通 量 ， 使 获取 的 影像 对 比 度 较 低 。 另 外 ， 除 了 这 些 生 物 物理 特征 造成 的 明显 低 对 比 
度 外 ， 人 为 因素 也 会 对 它 产生 影响 。 另 一 个 导致 遇 感 影像 对 比 度 低 的 因素 是 传感器 的 灵敏 
度 。 为 了 方便 遥感 影像 分 析 人 员 对 图 像 进 行 判读 解 译 ， 需 要 对 其 进行 增强 处 理 。 

在 MATLAB 中 ， 使 用 histeq0 函 数 可 以 实现 直方 图 匹配 。 

图 11-1a 显示 了 地 球 的 一 幅 图 像 f 图 11-lb 显示 了 使 用 imhist( 函 数 得 到 的 直方 图 。 由 
于 这 幅 图 像 中 存在 大 片 的 较 暗 区 域 ， 所 以 直方 图 中 的 大 部 分 像素 都 集中 在 灰 度 级 的 暗 端 。 乍 
一 看 ， 人 们 会 认为 利用 直方 图 均衡 化 来 增强 图 像 是 一 种 较 好 的 方式 ， 以 便 使 较 暗 区 域 中 的 细 
节 更 加 明显 。 然 而 ， 使 用 命令 

SF=histeq(f 256) 


得 到 如 图 11-1c 所 示 的 图 像 结果 表明 ， 利 用 直方 图 均衡 化 方法 在 此 应 用 举例 中 并 没有 得 到 特 
别 好 的 效果 。 对 此 ， 通 过 研究 均衡 化 图 像 〈 见 图 11-1d) 可 以 看 出 原因 。 这 里 ， 我 们 看 到 灰 
度 级 已 经 移动 到 了 灰 度 级 的 上 半 部 分 ， 因 而 输出 图 像 出 现 了 褪色 现象 。 灰 度 级 移动 的 原因 是 
原始 直方 图 中 的 暗色 分 量 过 于 集中 在 0 附近 。 从 而 ， 由 该 直方 图 得 到 的 累计 变换 函数 非常 
陡 ， 因 此 才 把 在 灰 度 级 低 端 过 于 集中 的 像素 映射 到 了 灰 度 级 的 高 端 。 直 方 图 均衡 化 的 程序 代 
码 如 下 : 


| 














% 直 方 图 均衡 化 


31. 














clear all 

%%6% 显 示 原 始 图 像 

个 imread(moontif); 
subplot(2,2,1),imshow(; % 原 始 图 像 
subplot(2,2,2)imhist(D; % 原 始 图 像 的 直方 图 
%9%% 对 原始 图 像 进行 直 方 图 均衡 化 
-histeq(f256); 

subplot(2.2,.3),imshow(g); 
subplot(2.2,4),imhist(g); 


执行 程序 代码 后 ， 效 果 如 图 11-1 所 示 。 








图 11-1 直方 图 均衡 化 


al 原始 图 像 b) 原始 图 像 的 直方 图 c) 直方 图 均衡 化 后 的 图 像 ”d) 均衡 化 后 的 直方 图 


一 种 补偿 这 种 现象 的 方法 是 使 用 直方 图 匹配 ， 期 望 的 直方 图 在 灰 度 级 低 端 应 有 较 小 的 集 
中 范围 ， 并 能 够 保留 原始 图 像 直 方 图 的 大 体形 状 。 由 图 11-lb 可 知 ， 直 方 图 主要 有 两 个 峰 
值 ， 较 大 的 峰值 出 现在 原点 处 ， 较 小 的 峰值 出 现在 灰 度 级 的 高 端 。 可 使 用 多 峰值 高 斯 函数 来 
模拟 这 种 类 型 的 直方 图 。 

由 于 直方 图 均衡 化 在 一 些 举例 中 出 现 的 问题 主要 是 原始 图 像 0 级 的 灰 度 附近 像素 过 于 
集中 ， 因 而 较为 合理 的 手段 是 修改 该 图 像 的 直方 图 ， 使 其 不 再 有 此 性 质 。 图 11-2 显示 了 一 
个 函数 的 图 形 〈 利 用 如 下 程序 manualhist 得 到 ， 参 数 分 别 为 0.15,0.05,0.75,0.05,1,0.07， 
0.002)， 它 不 仅 保留 了 原始 直方 图 的 大 体形 状 ， 而 且 在 图 像 的 较 暗 区 域 中 灰 度 级 有 较为 平 
滑 的 过 渡 。 


处 理 的 应 用 
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图 11-2 双 峰 高 斯 函数 





function -manualhist 
Tepeats=true; 
quitnow=x'; 
Pp=twomodegauss(0.15,0.05,0.75,0.05,1,0.07.0.002); 
while repeats 
s=-input(Enter ml,sigl,m2,sig2,Al1,A2,k,OR x to quit'vs)); 
ifs 一 quitnow 
break 
end 
v=str2num(s); 
ifnumel(v)=7; 
dispCIncorrect number ofinputs) 
coninue; 
end 
p=twomodegauss(v(1),v(2),v(3),v(4),v(S),v(6)v(7)); 
figure,plot(p); 
xlim([0 255]); 
end 


子 函 数 p=twomodegauss(ml,sigl,m2,sig2,Al,A2Jo) 计 算 一 个 已 经 归 一 化 到 单位 区 域 的 双 
峰 高 斯 函数 ， 以 便 可 以 将 它 用 做 一 个 指定 的 直方 图 。 


fanction p=twomodegauss(ml,sigl,m2,sig2,Al,A2,JJ) 
cl=Al*(1/((2+pi)^0.5)*sigl); 

kl=2*(sig1^2); 

c2=A2*(1/(2*+pi)^0.5)*sig2); 

k2=2*(sig2^2); 

Zinspace(0,1.256); 
p=ktrclyexp(-((z-m1).^2)kl)+c2*rexp(-((z-m2).^2)/k2); 
p=p.sum(p(D)); 


程序 的 输出 p 由 该 函数 产生 的 256 个 等 间隔 点 组 成 ， 它 是 我 们 所 希望 的 指定 直方 图 。 利 
用 下 面 的 命令 可 以 得 到 具有 指定 直方 图 的 图 像 ， 图 11-3 所 示 为 最 终结 果 。 


gg=histeq(f ,p) 





所 用 程序 代码 如 下 : 


clear all; 

%%% 获 取 一 个 指定 的 函数 

pr=manualhist; 

%%% 使 结果 图 像 的 直方 图 与 获取 函数 图 像 一 至 
gg=histeq(fp); 

figure， 

subplot(l,2,1),imshow(gg); 
subplot(1.2,2):imhist(gg) 


执行 程序 后 ， 效 果 如 图 11-3 所 示 。 





b 
图 11-3 直方 图 匹配 增强 


a 直方 图 匹配 增强 的 效果 图 b) 期 望 图 像 的 直方 图 





图 11-4a 所 示 为 一 幅 月 球 图 像 。 从 图 中 可 以 看 出 ， 这 幅 图 像 比较 模糊 。 在 这 种 情况 下 ， 
就 需 对 图 像 进行 增强 处 理 〈 如 图 像 锐 化 )， 同 时 尽 可 能 地 保留 其 灰 度 色调 。 首 先 ， 用 下 列 语 
句 生成 一 个 拉 普 拉 斯 滤波 器 ， 其 中 心 为 -4。 
w4=fspecial(laplacian', 0); 


使 用 该 滤波 器 对 原始 图 像 进行 滤波 ， 得 到 图 11-4b。 可 以 看 到 ， 该 图 像 比 原 始 图 像 清 晰 了 
许多 。 为 了 得 到 更 清晰 的 图 像 ， 也 可 以 自己 设计 一 个 滤波 器 。 本 举例 通过 下 面 的 命令 设计 一 个 
中 心 为 -32 的 滤波 器 ， 得 到 图 11-4c。 正 如 我 们 所 预料 的 那样 ， 它 比 其 他 两 幅 图 像 都 要 清晰 。 









w8-[111;1-3214111]: 
本 举例 所 用 的 程序 代码 如 下 ， 效 果 如 图 .11-4 所 示 。 


clear all 
个 imread(Fximagemoonjpg); 
subplot( 





w4=fSpecial(laplacianv0); 
w8=[1111-32 43111; 





COSEETIS 


8&4=fimfilter( 人 w4,replicate'); 
g8=fimfilter( 人 w8,replicate'); 
Subplot(1,.3,2);imshow(g4); 
subplot(1,3,3);imshow(g8) 





下 原始 图 像 b) 中 心 为 -4 和 





6) 中 心 为 -32 的 滤波 效果 
对 遥感 图 像 进行 融合 ] 


图 像 融合 是 一 个 对 多 遥感 器 的 图 像 数据 和 其 他 信息 的 处 理 过 程 。 它 着 重 于 把 那些 在 空间 
和 时 空 上 宛 余 或 互补 的 多 源 数据 ， 按 一 定 的 规则 (或 算法 ) 进行 运算 处 理 ， 获 得 比 任何 单 
数据 更 精确 、 更 丰富 的 信息 ， 生 成 一 幅 具 有 新 和 、 滤 谱 、 时 间 特 征 的 合成 图 像 。 它 不 仅 
是 数据 间 的 简单 复合 ， 还 强调 信息 的 优化 ， 以 突出 有 用 的 专题 消除 或 抑制 无 关 的 信 
息 ， 改 善 目 标识 别 的 图 像 环 境 ， 从 而 增加 解 译 的 可 靠 性 ， 减 少 模糊 性 〈 即 多 义 性 、 不 完全 
性 、 不 确定 性 和 误 改善 分 类 ， 扩 大 应 用 范围 和 效果 。 

1. 基于 HSI 彩色 变换 的 图 像 融合 

此 举例 是 采用 基于 HSI 彩色 变换 的 小 波 融合 算法 。 其 基本 思路 是 




































多 光谱 图 像 和 高 分 





辨 率 图 像 进行 几何 配 准 ， 然 后 三 羊 能 
力 ; 对 II 


信息 不 变 ， 
上 ， 而 后 对 同时 具有 低频 信和 4 
的 工 将 会 最 大 限度 地 保留 原来 多 光谱 图 人 
后 将 变换 后 的 了 、S、I 分 量 在 RGB 三 了 级 联 ， 得 到 融合 后 的 RGB 空间 图 像 。 

需要 注意 的 是 ，Chavez 等 于 1991 年 指出 ， 用 来 进行 多 分 辨 率 数据 融合 的 所 有 方法 中 ， 
HSI 方法 造成 光谱 特征 的 畸变 最 严重 ， 因 此 使 用 该 方法 时 要 谨慎 ， 特 别 是 需要 对 数据 进行 详 
细 的 辐射 分 析 时 。 

应 用 举例 的 程序 代码 如 下 : 








clear all 
9%6%6%6 分 辩 率 图 像 

fl-imread(mapljpg 

subplot(2,2.1),imshow(fl) 

%%6%6 利 用 插值 将 多 光谱 图 像 放 大 到 与 高 分 辩 率 图 像 一 样 大 小 
[MIN]=size(fl); 

亿 -imread(map2jpg ) 




















亿 =imresize( 亿 ,[MN]"bilinear) 
subplot(2.2,2);imshow(f2); 
%%6% 将 RGB 空间 转换 为 HSI 
旭 =double(fl); 

亿 _hsi=rgb2hsv(P); 








[el s1]=wavedec2(f ,lsym47; 

和 =im2double(fT; 

[c2_h s2_h]=wavedec2(f2_h,l,sym49); 
[ec2_s s2_s]=wavedec2(fP2_s,lvsym49; 
[c2_is2_ 让 wavedec2(P_il， 
%9%6% 对 系数 进行 融合 
c_h=0.5*(c2_htcl); 
c_s=-0.5*(c2_stcl); 

c_i=cl; 

%%% 分 别 对 H 分 量 、S 分 量 、I 分 量 进行 直方 图 均衡 化 
f_h= waverec2(c_hisl,sym4); 










YYm4 






Waverec2(c_isl,sym47); 





isteq(f_iD; 
%%% 显 示 融 合 后 图 像 
greatG3,f_hf sf D; 
subplot(2.2,3):imshow(g); 


执行 程序 后 ， 结 果 如 图 11-5 所 示 。 





可 日 


图 11-5 遥感 图 像 融合 





al 高 分 辩 率 图 像 b) 多 光谱 图 像 “) 融合 后 的 图 像 


采用 的 数据 源 为 SPOT 10m 分 辩 率 多 光谱 图 像 和 SPOT 2.5m 高 分 辨 率 图 像 如 图 11-5a、b 
所 示 。 从 图 11-5 上 可 以 看 出 ，SPOT 2.5m 高 分 辨 率 图 像 具 有 更 多 的 道路 网 信 
型 建筑 的 边缘 细节 信息 ， 而 SPOT 10m 分 辨 率 多 光谱 图 像 则 含有 丰富 的 彩色 信 ， 









表示 植被 覆盖 〈 波 段 合 成 为 SPOT 近 红 外 波段 、 红 波段 、 绿 波段 )， 灰 绿色 为 水 体 ， 褐 色 
为 建筑 物 。 
图 像 融合 的 具体 目标 在 于 提高 图 像 空间 


分 辩 率 〈 图 像 锐 化 )， 改 善 图 像 几何 精度 ， 增 强 
特征 显示 能 力 ， 改 善 分 类 精度 ， 提 供 变换 检测 能 力 ， 替 代 或 修补 图 像 数 据 的 缺陷 等 。 经 过 融 
合 ， 得 到 的 结果 图 像 如 图 11-5c 所 示 。 可 以 看 到 ， 融 合 后 的 图 像 不 但 有 较 好 的 空间 特征 和 纹 
理 特征 ， 而 且 具 有 较 好 的 多 光谱 保持 能 力 。 

2 基于 小 波 变换 的 图 像 融 合 

本 书 第 9 章 介 绍 了 小 波 变换 图 像 融合 的 基本 原理 。 本 举例 所 用 的 高 分 辩 率 和 多 光谱 图 像 
如 图 11-5a、b 所 示 ， 所 用 程序 代码 如 下 ; 









mul=imread(mapjpg); 
hr=imread(map2jpg) 
[mn]=size(hrj; 


mul=imresize(tmul,[m,n]vbilinear); 





[ec_bs_bj=wavedec2(mul_b,lvsym47; 
c_r-0.5*(c_hrtc_ 中 
c_g-0.5*(c_hrrc_ gj; 
c_b=0.5*(c_hrtc_bj; 
fr=waverec2(c_rhrsym47; 
f_r=histeq(f_D; 

人 g=waverec2(c_ghrvsym4); 
他 g=histeq(f 8; 
fb=waverec2(c_bhrsym47; 
fb=histeq(f_b); 

作 =catG3,frf gf b); 
figure:imshow(g); 


执行 程序 后 ， 效 果 如 图 11-6 所 示 。 
与 传统 的 数据 融合 算法 〈 如 HSI 等 ) 相 比 ， 小 波 融合 模型 不 仅 能 够 针对 输入 图 像 的 不 
同 特征 来 合理 选择 小 波 基 以 及 小 波 变换 的 次 数 ， 而 且 在 融合 操作 时 又 可 以 根据 实际 需要 来 
引入 双方 的 细节 信息 ， 从 而 表现 出 更 强 的 针对 性 和 实用 性 ， 融 合 效果 更 好 。 另 外 ， 从 实施 
过 程 的 灵活 性 方面 评价 ，HSI 变换 只 能 而 且 必 须 同时 对 3 个 波段 进行 融合 操作 ，PCA 分 析 
的 输入 图 像 必 须 有 3 个 或 3 个 以 上 ， 而 小 波 方法 则 能 够 完成 对 单一 波段 或 多 个 波段 进行 的 


11.2 MATLAB 在 医学 图 像 处 理 中 的 应 用 


MATLAB 凭借 其 强大 的 矩阵 运算 功能 和 直观 的 编程 风格 。 在 医学 图 像 处 理 中 得 到 了 三 





图 11-6 小 波 变换 融合 后 的 图 像 





训 





泛 的 应 用 。 本 节 主 要 介绍 MATLAB 医学 图 像 处 理 概述 、 医 学 图 像 增 强 、 灰 度 变换 等 内 容 。 






学 成 像 已 经 成 为 现代 医疗 不 可 或 缺 的 一 部 分 ， 其 应 用 贯穿 整个 临床 工作 ， 不 仅 广泛 用 
断 ， 而 且 在 外 科 手 术 和 放射 治疗 等 的 计划 设计 、 方 案 实 施 以 及 疗效 评估 方面 发 挥 着 
重要 的 作用 。 目 前 ， 医 学 图 像 可 以 分 为 解剖 图 像 和 功能 图 像 两 个 部 分 。 解 剖 图 像 主 要 描述 人 
体形 态 信息 ， 包 括 X 射线 透射 成 像 、CT、MRI、US， 以 及 各 类 内 罕 〈 如 腹腔 镜 及 喉 镜 ) 获 
取 的 序列 图 像 等 。 另 外 ， 还 有 一 些 衍 生 而 来 的 特殊 技术 ， 如 从 X 射线 成 像 衍 生 而 来 的 
DSA， 从 MRI 技术 衍生 而 来 的 MRA， 从 US 成 像 衍生 而 来 的 Doppler 成 像 等 。 功 能 图 像 主 
要 描述 人 体 代 谢 信息 ， 包 括 PET、SPECT、fMRI 等 。 同 时 ， 也 有 一 些 广义 的 或 者 使 用 较 少 
的 功能 成 像 方式 ， 如 EEG、MEG、pMRI (perfusion MRI)、fCT 等 。 

在 医学 教学 、 科 学 研究 以 及 临床 工作 中 ， 我 们 要 处 理 很 多 医学 图 像 ， 借 助 MATLAB 7.0 
图 像 处 理工 具 箱 ， 可 以 大 大 提高 工作 效率 。MATLAB 在 医学 图 像 处 理 中 的 应 用 主要 包括 以 
下 方面 。 

1) 显 微 图 像 处 理 。 

2) DNA 【脱氧 核 糖 核酸 ) 显示 分 析 。 

3) 红 、 白 血球 分 析 计数 。 

4) 虫 卵 及 组 织 切片 的 分 析 。 

5) 癌 细 胞 识别 。 

6) DSA〈 心 血管 数字 减 影 ) 及 其 他 减 影 技 术 。 

7) 内 脏 大 小 形态 及 异常 检测 。 

8) 微 循环 的 分 析 判 断 。 

9) 心脏 活动 的 动态 分 析 。 

10) 热 像 分 析 ， 红 外 像 分 析 。 

11) X 光 照片 增强 、 冻 结 及 伪 色 彩 增 强 。 

12) CT、MRI、Y 射线 照相 机 ， 正 电子 和 质子 CT 的 应 用 。 

13) 生物 进化 的 图 像 。 

读者 可 以 参阅 相关 专业 书籍 来 查看 这 些 方面 的 应 用 实例 。 这 里 从 灰 度 变换 、 品 声 去 除 等 
几 个 方面 介绍 MATLAB 图 像 处 理 函 数 在 医学 图 像 处 理 中 的 应 用 。 


111.2.2 | 医学 图 像 的 灰 度 变 换 | 


医学 图 像 反 映 的 是 X 射线 穿 透 路 径 上 人 体 各 生理 组 织 部 位 对 X 射线 吸收 量 的 累加 值 ， 
而 人 体内 生理 组 织 是 相互 重 琶 的 ， 一 些 组 织 结构 由 于 与 X 射线 吸收 量 较 大 的 组 织 重 登 而 无 法 
在 X 射线 影像 上 清晰 地 显示 。 另 外 ， 在 CT 系统 成 像 过 程 中 ， 由 于 图 像 板 中 的 磷 粒 子 使 X 射 
线 存 在 散射 ， 在 扫描 过 程 中 ， 激 光 扫描 仪 的 激光 在 穿 过 图 像 板 的 深部 时 存在 着 散射 ， 从 而 使 
图 像 模 糊 ， 降 低 了 图 像 分 辨 率 。 应 用 图 像 增 强 处 理 方法 凸显 组 织 边缘 和 细节 ， 成 为 医学 图 像 
处 理 的 迫切 需要 。 

图 像 增强 就 是 一 种 基本 的 图 像 处 理 技 术 ， 增 强 的 目的 是 对 图 像 进行 加 工 ， 以 得 到 对 医务 
工作 者 来 说 视觉 效果 更 好 、 更 易于 诊断 的 图 像 。 图 像 增强 根据 图 像 的 模糊 情况 采用 了 各 种 特 


























殊 的 技术 突出 图 像 整 体 或 局 部 特征 ， 常 、 
波 〈 高 斯 平滑 )、 中 值 滤波 、 梯 度 增 强 、 拉 普 拉 斯 增 及 频 域 的 高 通 、 低 通 
算法 运算 量 大 、 计 算 复杂 、 开 始 难度 大 。 针 对 这 些 问 题 ， 可 以 在 MATLAB 环 







观 图 示 。 
1. 使 用 imshow() 函 数 改变 图 像 对 比 度 
下 面 就 回忆 一 下 它 的 用 法 。 该 函数 用 于 显示 和 代 








党 规 的 图 像 ， 





调用 格式 为 

@ imshow (fG) 
其 中 ,了 是 一 个 图 像 数 组 ，G 是 显示 该 图 像 的 灰 度 级 数 。 若 将 G 省 略 ， 则 默认 的 灰 度 级 数 是 
256。 该 函数 的 另 一 种 调用 格式 为 

@ imshow (fllowhigh]) 

这 种 调用 格式 会 将 所 有 小 于 或 等 于 low 的 值 都 显示 为 黑色 ， 所 有 大 于 或 等 于 high 的 
值 显示 为 白色 。 界 于 low 和 high 之 间 的 值 将 以 默认 的 级 数 显 示 为 中 等 亮度 值 。 最 后 ， 调 
用 格式 

@ imshowGf[]) 
可 以 将 变量 low 设置 为 数组 f 的 最 小 值 ， 将 变量 high 设置 为 数组 f 的 最 大 值 。Imshow0 
函数 的 这 一 形式 在 显示 一 幅 动态 范围 较 小 的 图 像 或 轻 有 正 值 又 有 负 值 的 图 像 时 非常 有 
用 。 在 医学 图 像 中 ， 由 于 一 系列 原因 ， 获 取 的 信号 会 较 弱 ， 应 用 该 函数 对 图 像 进行 增强 
十 分 有 效 。 

如 图 11-7 所 示 ， 可 以 很 明显 地 看 到 ， 动 态 范围 很 小 ， 图 像 很 暗 ， 对 比 度 很 低 ， 没 有 明 
这 样 的 图 像 很 难 用 眼睛 去 观察 它 内 部 包含 的 信息 。 使 用 imshow(0) 函 数 拉 伸 后 ， 图 
数 果 明 显得 到 改善 ， 动 态 范围 扩大 。 如 果 将 原始 图 像 的 亮度 值 扩展 到 显示 设备 的 全 部 
让 围 ， 效 果 就 更 佳 。 


























图 11-7 ”医学 图 像 增强 


昌 应 用 举例 
引 原始 图 像 b) 增 像 


此 举例 是 使 用 imshow() 函 数 实现 图 像 增 强 ， 程 序 代 码 如 下 : 











clc 


clear all 
% 从 路 径 盘 中 读 入 一 幅 原 始 图 像 
=imread(Fximage\Xmapjpg); 
figure,imshow(D); 

title(' 原 始 
%6%6%6 将 






始 图 像 进 行 增强 操 

figure,imshow(L[ ]) 

title( 增 强 后 图 像 ) 
2. 使 用 imadjust() 函 数 调整 图 像 亮度 
imadjustO) 函 数 是 对 灰 度 图 像 进 行 亮度 变 换 的 基本 IPT 


工具 。 它 的 调用 格式 为 


@ sg-imadjust(f[low_in high in],[low_out high_outl,gamma) 


该 函数 将 图 像 f 中 
low_out 一 high_out 之 间 。low_in 以 下 的 值 与 high_in 以 
low_in 以 上 的 值 映射 为 low_out，high_in 以 下 的 值 映射 为 





uint16 或 double 型 图 像 ， 输 出 图 像 与 输入 图 像 有 着 相同 的 类 


所 有 输入 参数 均 指 定 在 0 一 1 之 间 ， 而 不 论 图 像 了 的 类 型 。 
函数 将 乘 以 255 来 确 
65535。 若 [low_in high_in] 或 [low_out high_out] 使 用 空 矩 
high_out 小 于 low_out， 则 输出 亮度 会 反 转 。 

参数 gamma 指定 了 曲线 和 ， 该 曲线 用 来 映射 
gamma 小 于 1， 了 映射 被 加 权 至 更 高 〈 更 亮 ) 的 输出 值 ; 若 














: 度 值 映射 到 g 中 ， 即 将 low_in 一 high_in 之 间 的 的 值 映射 到 


-的 值 则 被 剪 切 掉 了 ， 换 句 话说 ， 
high_out。 输 入 图 像 应 该 为 uintg， 
] 像 了 外 ，imadjustO 函 数 的 
若 f 是 uint8 型 图 像 ， 则 imadjust(O) 





应 用 中 的 实际 值 ; 若 f 是 uint16 型 图 像 ， 则 imadjustO) 函 数 将 乘 以 


年 〈[ ]) 会 得 到 默认 值 [0 1]。 若 


f 的 亮度 值 ， 以 便 生 成 图 像 g。 若 
gamma 大 于 1， 则 映射 被 加 权 至 更 


低 〈 更 暗 ) 的 输出 值 ， 若 省 略 了 函数 的 参量 ， 则 gamma 默认 为 1 (线性 映射 )。 
以 下 命令 将 05 一 075 之 间 的 灰 度 级 扩展 到 0 一 1〈 见 图 11-8)。 








图 11-8 使 用 imadjustO) 函 数 进行 图 像 变 换 








像 b) 灰 度 反 转 后 的 图 像 c) 部 分 区 域 灰 度 变 换 ”d) gamma=2 的 图 像 





39090909609090 
clc 


clear 
全 imread(F:\image\hand.jpg); 
subplot(2,2,1); 
imshow(f); 
title(' 原 始 图 像 ) 
%9%6% 将 原始 图 像 艾 度 反 转 
gl=imadjust(f[0 1],[0 1]); 
Subplot(2,2,2); 
imshow(g1) 
title( 灰 度 反 转 后 图 像 ) 
%%6% 将 原始 图 像 0.5 一 0.75 之 间 的 灰 度 级 扩展 到 [0 1 
8g2=imadjust(f[0.5 0.75].[0 1]); 
subplot(2,2,.3); 
imshow(g2) 
title( 部 分 区 域 灰 度 变换 
% 将 gamma 值 设置 为 2 
g3=imadjust(f[ ],[0 1]); 
subplot(2,.2,4); 
imshow(g3) 
titleCgamma=27) 


3. 自 定义 函数 intrans() 
对 图 像 的 动态 范围 进行 改变 有 很 多 方法 ， 如 对 数 、 对 比 拉 伸 等 。 对 数 变换 通过 下 式 来 


8g=clog(1+double(D) (11-1) 
式 中 ，e 是 一 个 常数 。 对 数 变换 的 一 项 主要 应 用 是 压缩 动态 范围 。 例 如 ， 傅 里 叶 频 谱 的 范围 





为 [0 109 或 更 高 。 当 传 里 叶 频 谱 显示 于 已 线性 缩放 至 gbit 的 监视 器 上 时 ， 高 值 部 分 占 优 ， 从 
而 导致 频谱 中 低 亮度 值 的 可 视 细节 丢失 。 通 过 计算 对 数 ，10% 左右 的 动态 范围 就 会 下 降 到 可 
以 接受 、 方 便 观察 的 范围 ， 从 而 更 有 利于 处 理 。 

下 面 的 函数 称 为 对 比 度 拉 伸 函 数 ; 

1 
AN 本 1-2) 

式 中 ,~ 是 输入 图 像 的 亮度 ，s 是 输出 图 像 中 的 相应 亮度 值 ;已 是 该 函数 的 斜率 。 由 于 7T(r) 的 
限制 值 为 1， 所 以 在 执行 此 类 变换 时 ， 输 出 值 也 被 缩放 在 [0 1 内。 因为 该 函数 可 以 将 输入 值 
低 于 闫 的 灰 度 级 压缩 在 输出 图 像 中 较 暗 灰 度 级 的 较 窄 范围 内 ， 类 似 地 ， 该 函数 可 将 输入 值 高 
于 六 的 灰 度 级 压缩 在 输出 图 像 中 较 亮 灰 度 级 的 较 窗 范围 内 。 输 出 的 是 一 幅 具 有 较 高 对 比 度 的 
图 像 。 

根据 以 上 所 述 ， 自 定义 M 函数 如 下 。 

fonction g=intrans(fvarargin); 


error(nargchk(2,4,nargin)); 
classin=class(D); 





ifstrcmp(class(D,double)&max(RL)>1&~strcmp(vararginfljvlog) 
仁 mat2gray(f; 


else 
人 im2double(f; 
end 
method=vararginf1}; 
switch method 
case "meg' 
eg=imcomplement(D; 
case 'log 
iflength(varargin)==1 
c=1; 
elseif length(varargin)=-2 
c=varargin{f2}; 
elseif length(varargin) 一 3 
c=varargin{2} 
classin=varargin{3} 
else 
eror(Incorrect number of inputs for the log option) 
end 
er-cr(log(1+double(D)); 
case 'gamma' 
iflength(varargin)<2 
error(Not enough inputs for the gamma option) 
end 
gam=varargin{f2}; 
Simadjust([],0],gam); 
case 'stretch 
iflength(varargin)==1 
m=mean2( 有 ; 
E=4.0; 
elseif length(varargin)-3 
me=varargin{f2}; 
E=varargin{3}; 
else error(Incorrect number ofinputs for the tretch option) 
end 
本-1(I+(m(fheps))AE); 
otherwise 
error(CUNknown enhancement method.) 
end 


自 定义 M 函数 是 将 这 些 方法 利用 MATLAB 来 生成 一 个 符合 自己 需要 的 函数 ， 在 这 个 函 
数 中 ， 用 户 可 以 根据 自己 的 需要 选择 拉 伸 和 拉 伸 因 子 。 

图 11-9a 显示 了 一 幅 骨 骼 图 像 ， 通 过 图 像 可 以 观察 到 ， 原 始 图 像 对 比 度 比较 低 ， 其 中 的 
大 部 分 信息 都 不 能 用 肉眼 很 好 地 观察 到 。 使 用 自 定义 的 intrans0 函 数 对 其 进行 对 比 度 拉 伸 ， 
获得 如 图 11-9b 所 示 的 结果 。 和 图 11-9a 相 比 ， 图 11-9b 在 视觉 方面 的 改善 效果 是 明显 的 。 


22 人 | 














clear all; 

全 imread(bonejpg) 

subplot(1,2,1);imshow(D); 半 
% 对 图 像 进 行 拉 伸 

gr-intrans(f'stretch,mean2(im2double(D),0.8); 

subplot(1,2,2);imshow(g); 





执行 程序 后 ， 效 果 如 图 11-9 所 示 。 














医学 图 像 增强 | 
而 保持 了 高 频 相 对 不 变 点 ， 这 样 会 突出 图 像 的 边缘 和 
细节 ， 使 图 像 边 : if 但 由 于 高 通 滤波 器 偏离 了 直 ， 从 而 把 图 像 的 平均 值 降低 到 
了 零 。 一 种 补偿 通 滤 波 器 加 上 一 个 偏 移 量 。 若 偏 移 量 与 滤波 器 乘 以 一 个 大 于 1 的 
常数 结合 起 来 ， 则 这 种 广 法 就 称 为 高 频 强调 滤波 ， 因 为 该 常量 乘 数 突出 了 部 分 。 这 个 乘 
数 同时 增加 了 低频 部 分 的 幅度 ， 但 只 要 偏 移 量 与 乘 数 项 比较 小 ， 低 频 增强 的 影响 就 弱 于 高 频 
的 影响 。 高 波 器 的 传递 函数 为 。 

Pse(Goy)=a+bFp(n (11-37 
式 中 ，a 是 偏 移 量 ; 也 是 乘 数 ， 感 (ev) 是 高 通 滤波 器 的 传递 函数 

利用 高 频 强 调 滤波 和 直方 图 均衡 化 对 医学 图 像 进行 处 理 ， 如 图 11-10 所 示 。 


图 11-10 高 








高 通 滤 波 器 削弱 傅 









































图 11-10 ”高 频 强调 滤波 〈 续 





a 原始 图 像 b) btw 滤波 后 的 图 像 。) 高 





9696969696%6 

cle 

clear 

全 imread(lena.tif); 

subplot(2,2,1); % 在 同一 个 窗口 中 显示 多 幅 图 像 
imshow(D); 

title(' 原 始 图 像 ) 

% % % 对 图 像 进行 填 充 
PQ=paddedsize(size(D); 

% % % 高 通 滤 波 

D0=0.05*PQ(1); 
HBW=hpfilter(btw,PQCD),PQC),D0.2); 
gbw=dftfilt(fEHBW); 

gbw=uint8(gbw); 

subplot(2,.2.2); 

imshow(gbw); 

title(btw 滤波 后 图 像 ) 

%% % %% 高 频 强 调 滤波 

H=0.5+2*HBW; 

gh 人 dftfit(H); 

ghf=uint8(ghf; 

subplot(2,2.3); 

imshow(ghpD 

title( 高 频 强 调 滤波 后 图 像 ) 

% % % 对 高 频 强 调 滤波 后 ， 图 像 进行 直方 图 均衡 化 
ghe=histeq(ghf256); 

ghe=uint8(ghe); 

subplot(2.2,4); 

imshow(ghe) 

title( 直方 图 均衡 化 图 像 ) 


上 例 所 用 子 函 数 如 下 : 
1) PQ=paddedsize (AB，CD，PARAM) 对 和 输入 图 像 进行 填充 ， 








强调 滤波 后 的 图 像 d) 直 方 图 均衡 化 后 的 图 像 


以 便 形 成 的 方形 的 大 小 


等 于 最 近 的 2 的 整数 次 寡 。 
2) g=dftfilt(PHD) 接 收 输入 图 像 《 和 一 个 滤波 函数 卫 ， 可 处 理 所 有 的 滤波 细节 并 输出 经 滤 
波 和 前 切 后 的 图 像 g。 
3) [U,V]=dftuv(MN) 提 供 了 距离 计算 及 其 他 类 似 应 用 所 需要 的 网 格 数组 。 
4) [H.D]=lpfilter(type,MN,D0,m) 实 现 低 通 滤波 。 
5) H=hpfilter(type,M,N,D0.m 实 现 高 通 滤 波 。 
它们 的 代码 如 下 : 


function PQ=paddedsize(AB,CD,PARAMD 
ifnargin == 1 
PQ=2*AB; 
elseif nargin= =2 有 ~ischar(CD) 
PQ=AB+CD-1; 
PQ=2*ceil(PQ/2); 
elseif nargin= =2 
m=max(AB); 
P=2^nextpower(2*m); 
PQ=[P.P]; 
elseif nargin= =3 
m=max([AB CD]); 
P=2^nextpower(2*m); 
PQ=[P,P]; 
else 
error(' Wrong number ofinputs.) 
end 
309%0%6 
9%69%6%6 
function g=dftfilt(EH) 
F= 作 2(fsize(H,1),size(H,2))》 
g=real(iff2(H.*F)); 
g=g(l:size(f1),1:size(f2)); 
969690 
969696 


function [U,V]=dftuv(M,N) 





idx=find(u>M/2); 

udidx)=ufidx)-M; 

idy=find(v>N/2); 

vidy)=vGidy)-N; 
[V.UlFmeshgrid(vu; 

9%69696 

9%69696 

function [HLD]=Ipfilterttype,MN,DOn) 
[U,V]F=dftuv(MN); 





名 





D=sqrt(U.2+V.^2); 
switch type 
case ideal' 
H=double(D<=D0); 
case'btw' 


ifnargin= =4 








nm 


end 
H=1.(1+(DJDO).A(C2*n)); 
case 'gaussian' 
H=exp(-(D.^2)LC2*(D0^2)); 
otherwise 
error(UNknow filter type.) 
end 
9%6969%6 
96%69%6 
function H=hpfilterttype,M,N,DO.n) 
inargin= =4 
n=1; 
end 
Hlp=ipfilter(type,MN,DO.n); 
H=1-Hlp; 


MATLAB 在 遥感 图 像 中 的 应 用 主要 有 哪 几 个 方面 ? 


小 波 变换 图 像 融 合 与 HSI 图 像 融合 相 比 具有 哪些 优势 ? 试 对 同一 幅 图 像 同 时 进行 
HIS 图 像 融 合 和 小 波 变换 图 像 融合 。 
11-3 MATLAB 在 医学 图 像 处 理 中 的 应 用 主要 有 哪 几 个 方面 ? 
11-4， 试 编写 程序 ， 自 定义 一 个 函数 实现 图 像 的 位 置 及 大 小 的 改变 。 
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附录 A MATLAB 6.X 图 像 处 理工 具 箱 函 数 


表 A-1 通用 函数 


功能 


语 法 





colorbar 


显示 颜色 条 


colorbar 
eolorbar(Vert) 
eolorbar('horiz) 
colorbarth) 
he colorbar( 
eolorbar(…,peer'axes_handle) 








etimage 


从 坐标 轴 取 得 图 像 数据 


A=getimage(h) 
[Poy,AT getimage(h) 
[Anag]= getimageh) 
[和 getimage 








imshow 


显示 图 像 


imshow(Ln) 
imshow(Llow high]) 
imshow(BW) 
imshow(Xvmap) 
imshow(RGB) 
imshow(…vdisplay_option) 
imshow(xy'A…) 

imshow filename 
himshow(…) 





montage 


在 矩形 框 中 同时 显示 多 幅 图 像 


montage(D) 
montage(BW) 
montage(Xmap) 
montage(RGB) 
HE montage(…) 





immovie 


创建 多 帧 索引 色 图 像 的 电影 动画 


mov=immovieCXmap) 
mov= immovie(RGB) 





subimage 


在 一 幅 图 中 显示 多 个 图 像 


Subimage(Xmap) 
subimageD) 
subimage(BW) 
subimage(RGB) 
subimage(xy， 
hsubimage(…) 








truesize 


调整 图 像 显示 尺寸 


tmuesizetfig mrows meols]) 
tmuesize(fig) 





warp 


将 图 像 显示 到 纹理 映射 表面 


warp(Xmap) 
warp(Ln) 
warp(z 
warp(xy,Zr) 
人 warp( 








zoom 





缩放 图 像 





zoom on 
zoom i 主 

zoom out 

zoom reset 

zoom 

zoom xon 

zoom yon 
zoomffacton 
zoomdfig ,option) 

















表 A-2 几何 操作 函数 


功 








imerop 


剪 切 图 像 





imerop(D) 





X2=i 

RGB2= imerop(RGB) 
12= imerop(Lrect) 

RGB2= imcrop(RGB; rect) 
imerop(xsy 






[xy ,Arect= imcrop(… 








imresize 


改变 图 像 大 小 


B= imresize(A,mvmethod) 





imrotate 


旋转 图 像 


B= imrotate (Auangelmethod) 





B= imrotate(Aangelmethod,erop) 


表 A-3 图 像 文 件 1O 函数 





功能 


语 ”法 





imfinfo 


返回 图 形 文件 信息 


info= imfinfo(filename, fmb 
info= imfinfo(filename) 





imread 


从 图 形 文件 中 读 取 图 像 


A= imread(filename,fimt) 
[X-mpal= imread(filename.fmb 
imread(filename) 








) (GIF only) 

(HDF only) 
BackgroundColor,BG) (PNG only) 
Amapsalpha]= imread(…) (ICOCUR. and PNG only) 





imwrite 


把 图 像 写 入 图 形 文件 中 





Aifilename,fnb) 
imwrite(Xmap,filename fmt) 
filename) 
Param1,Vall,Param2,Val2, 








imwrite( 





表 A-4 线性 滤波 函数 








conv2 


进行 二 维 卷 积 操作 


C=econv2(AJB) 
Cr=conv2(heolhrow'A) 
C= conv2(…, shape) 





convmtx2 


计算 二 维 卷 积 矩阵 


T=convmb2(Hmn) 
T=convmtx2(H,Im n]) 





convn 


计算 呈 维 卷 积 


Cr=eonvn(A,B) 
Cr=eonvn(A,B, shape) 





filter2 


进行 二 维 线性 过 滤 操 作 


ter2(h,X) 
iter2(h,Xshape) 








便 pecial 








创建 预定 义 过 滤器 


hr fspecialttype) 
hr 人 pecialttypeuparameters) 












































































































corr2 计算 两 个 矩阵 的 二 维 相关 系数 rcorr2(A,B) 
meontourn) 
imcontour(Lv) 
imcontour 一 创建 图 像 数据 的 轮廓 图 imcontour(xyy…) 
imcontour(…LineSpec) 
[Ch]= imcontour(…) 
村 stats= imfeature(Lmeasurements) 和 
imfeature 计算 图 像 区域 的 特征 尺寸 Stats= imfeature(L measurementsn) 
imhist(Dn) 
imhist 显示 图 像 数 据 的 柱状 图 imhist(Xmap) 
[countXj= imhist(…) 
P= impixei0D) 
P= impixel(Xumap) 
P=impixel(RGB) 
P= impixel(lieur) 
P= impixel(Xumapvc,D) 
impixel 确定 像素 颜色 值 Pimpixel(RGB,cr) 
[erP= impixel(…) 
P= impixel(xyJxiyi) 
天 el(Xy,Xmap,xiyi) 
P= impixel(xy,RGBx 
[ 上 =impixeloxy…) 
ce=improfile 
c=improfiletn) 
cimprofile(Lxiyi) 
c=improfile(Lxiyin) 
improfile 沿线 段 计 算 剖 面 图 的 像素 值 [exey 
[exeyewis 
[… 上 上 improfile(x,y.Lxiyi) 光 
improfile(xy,Lxiyin) 5 
[下 improfileC amethod) 
mean2 计算 矩阵 元 素 的 平均 值 B=mean2(A) 
pixval 显示 图 像 像素 信息 Pixval on 
std2 计算 矩阵 元 素 的 标准 偏 移 B=std2(A) 
表 A-6 图 像 增强 函数 
函数 功能 语法 
[ERDF= histeq(L…) 
histeq 用 柱状 图 均衡 化 增强 对 比 0 
newmap= histeq(Xumap) 
三 imadjust(Nlow in high_injliow_out high_outjgammay 
imadjust 调整 图 像 亦 度 值 或 颜色 映射 表 newmap-imadjusttmap,[low_in high_in],[low_out high_outhgamma) 
= imadjust(RGB1，…) 
imnoisefltype) 
imnoise 增强 图 像 的 泻 染 效果 mnnoisc(LtyPej leters) 
Be= medfil2(A,[mn]) 
medfilt2 进行 二 维 中 值 过 滤 B= medfilt2(A) 
B= medfilt2(Avindexed') 
B=ordfl2(Aorderdomain) 
ordfilt2 进行 二 维 统计 顺序 过 滤 B= ordfilt2(A,orderdomain,S) 
B= ordfit2(…,padopt) 
viener2 进行 二 维 适 应 性 去 喇 过 滤 处 理 | 1 wener2(L[m nunoise) 








[Inoisej= wiener2(LImm) 











表 A-7 图 像 分 析 函 数 








功能 


语 ”法 





识别 强度 图 像 中 的 边界 


BW= edge(l'sobely 

BW= edge(T，sobel whresh) 
BW=edge(l,sobelvthreshdirection) 
[BW ,thresh]= edge(vsobel…) 


BW= edge(l, prewitmy 

BW= edge(L prewittthresh) 

BW= edge(l，prewittvthreshs direction) 
[BW vthreshj= edge(L prewitt…) 


BW=edge(L roberts) 
BW=edge(L robertsvthresh) 





识别 强度 图 像 中 的 边界 


[BW threshj=edge(l roberts…) 
BW= edge(L tog) 

BW= edee(L log vthresh) 

BW= edge(L, log thresh,siema) 
[BWuthresholdj=edge(L log…) 
BW= edge(L，zerocrossvthreshuh) 
[BWMhresh]-edge(L，zerocross'， 
BW= edge(l,'canny) 

BW= edge(Icannyvthresh) 
BW= edge(l，canny threshusigma) 
[BWuhresholdj=edge(L canny…) 














qteetblk 


获取 四 叉 树 中 的 块 值 


[vals,ccj= qtgetblk(LS.dim) 
[valsidx]= qtgetblk(LSdim) 





qtsetblk 


设置 四 又 树 中 的 块 值 








表 A-8 线性 二 维 滤波 设计 函数 





功能 





freqspace 





确定 二 维 频率 响应 频 ; 


[2]- freqspacetn) 

[,P]- freqspace([mn]) 
[xly1]= freqspace(…, meshgrid) 
全 freqspace(N) 

全 freqspace(N,，whole) 








freqz2 


计算 二 维 频 率 响 应 


[HELPLP freqz2(hnlun2) 
THfLP]= freqz2(h,[n2 nl]) 
TH freqz2(hflLP) 
[HL freqz20h) 
[freqz20h…[dx dy]) 








fsamp2 


用 频率 采样 法 设计 二 维 FIR 过 滤器 


he fsamp2(Hd) 
h= fsamp2( 人 ,PHdm n]) 





frans2 


通过 频率 转换 设计 二 维 FIR 过 滤器 


he= ftrans2(b.D) 
h= ftrans2(b) 





fwindl 


用 一 维 窗口 方法 设计 二 维 FIR 过 滤器 


hr fwindl(Hdwin) 
h= fwindl (Hd,winl,win2) 
h= fwindl (flP,.Hd…) 





fwind2 





用 二 维 窗口 方法 设计 二 维 FIR 过 滤器 





h= fwind2(Hd,win) 
h= fwind2(fL. 人 2,Hdwin) 








表 A-9 二进制 图 像 操作 函数 



















































































































函数 功能 语 ”法 
applylut 在 二 进 制图 像 中 利用 lookup 表 进 行 边沿 操作 A= applyluttBW.LUT) 
bwarea 计算 二 进 制图 像 对象 的 面积 total= bwarea(BW) G) 
bweuler 计算 二 进 制图 像 的 欧 拉 数 euI= bweulerBWn) 
BWI= bwHIBWLenn) 
上 
bwfill 填充 二 进 制图 像 的 背景 BW2= bwfilltxyBWIxiyin) 
Cey.BW2,idxxiyi- bwfill(…) 
BW2= bwfill(BW1, holesvn) 
人 =bwfil(BWL holesn) 
bwlabel 标注 二 进 制图 像 中 已 连接 的 部 分 上 = bwlabelBWon) 
ywmorph(BW operation 
bwmorph 提取 二 进 制图 像 的 轮 席 BW2 让 W1 Et 
2 PPT se BW2= bwperim(BW1) 
bwperim 计算 二 进 制图 像 中 对 象 的 周 长 BW2- bwperim(BWLCONN) 
BW2= bwselect(BW1ern) 
BW2= bwselect(BW1.n) 
bwselect 在 二 进 制图 像 中 选择 对 象 [BW2.idx] -bwselect(…) 
BW2= bwselecttxyBW1xiyiD) 
[ey,BW2idxxiyi]= bwselect(…) 
BW2= dilate(BW1SE) 
醒 放大 二 进 制图 像 BW2= dilate(BW1,SE ,lag) 
ilate BW2= dilate(BW1LSE，……n) 
BW2= erode(BWLSE) 
弱化 二 进 制图 像 的 边界 BW2= erode(BW1,SE,alg) 
si BW2= erode(BW1SE…:n) 
makelut 创建 一 个 用 于 applylut() 函 数 的 look 表 本 
表 A-10 图 像 变 换 函 数 
功能 语法 
BEdeGCA) 
de 进行 二 维 离散 余弦 变换 B= dct2(Avmn) 
B= dcD(A,Imn]) 
dctmtx 计算 离散 余弦 变换 矩阵 D= dctmtxn) 
人 2 进行 二 维 快 速 传 里 叶 变换 
ffhn 进行 上 维 快速 人 埔里 叶 变 换 
fhshift 把 快速 传 里 叶 变换 的 DC 组 件 移 到 光谱 中 心 
idct2 计算 二 维 离散 反 余弦 变换 
ifn2 计算 二 维 快速 传 里 叶 反 变换 
iffin 计算 ” 维 快 速 傅 里 叶 反 变 换 
jnadon(Pvtheta 
iradon 进行 反 radon 变换 ion(Putheta.interpyfilterdn) 
[Lhj=iradon(…) 
P= Phantomtdefn) 
Phantom 产生 一 个 头 部 幻影 图 像 P= phantom(E,n) 
radon 计算 radon 变换 














ES 








表 A-11 颜色 空间 转换 函数 





函 





功能 





hsv2rgb 


转换 HSV 的 值 为 RGB 颜色 空间 


M= hsv2rgb(H) 





rgb2hsv 


转化 RGB 的 值 为 HSV 颜色 空间 


cmap= rgb2hsv(M) 





rgb2ntsc 


转化 RGB 的 值 为 NTSC 颜色 空间 


yiqmap= rgbIntsctrgbmap) 
YIQ= rgb2ntsc(RGB) 





rgb2ycber 


转化 RGB 的 值 为 YCBCR 颜色 空间 


ycbermap= rgb2ycber(rgbmap) 
YCBCR= rgb2ycber(RGB) 





ycber2rgb 


转化 YCBCR 的 值 为 RGB 颜色 空间 


rgbmap=ycbcr2rgb(ycbcrmap) 
RGB= ycbcr2rgb(YCBCR) 





mtsc2rgb 





转换 NTSC 的 值 为 RGB 颜色 空间 


rgbmap= ntsc2rgb(yiqmap) 
RGB= ntsc2rgb(YIQ) 








表 A-12 边沿 和 块 处 理 函 数 


功能 





语 “ 臣 





bestblk 


确定 进行 块 操作 的 块 大 小 


Siz= bestblk([m njk) 
[mbwnb]j= bestblk([mn].k) 





blkproc 


实现 图 像 的 显示 块 操作 


B= blkproc(A,m njfun) 
B= blkproe(A,[m n] fun,PLP2,) 
B=blkproc(A,[mn],Imborder nborder] fun…) 





col2im 


将 矩阵 的 列 重新 组 织 到 块 中 


A= col2im(B,[m n],[mm nn],block_type) 
A= col2im(B,[m nj,[mm nn]) 





colfilt 


利用 列 相关 函数 进行 边沿 操作 


B= colfilt(b,[m n],block_typefun) 

B= colfilt(b,[m n],block_typevfun,P1,P2,- 
B= colfiht(b,[m 中 , [mborder nborder]. 
B= colfilt(A, indexed…) 














im2col 


重 调 图 像 块 为 列 


B= im2col(A,[m n].block_type) 
B= im2col(A,Im n]) 
B- im2col(A, indexed' 








nlfilter 


进行 边沿 操作 


B= nlfilter(AIm n] fun) 
B= nlfilter(A,[m n],fun,PLP2,… 
B= nlfilter(A,'indexed'… 











表 A-13 区域 处 理 函 数 





函 


功能 





roicolor 


选择 感 兴趣 的 颜色 区 





icolor(AJow high) 
roicolortA,v) 








roifill 


在 图 像 的 任意 区 域 中 进行 平滑 插 补 


开 roifillcr) 
Jroifill(D) 

二 roifil(LBW) 
[DBWF= roifil 
二 roifill(xyJxi 
[CeyJ,.BWxiyi= roifil(…) 











roifilt2 


过 滤 敏 感 区 域 


roifil2(h.LBW) 
oifil2(LBW,fun) 
roifilt2(LBW,fun,PL,P2,…) 








roipoly 





选择 一 个 敏感 的 多 边 形 区 域 





BW= roipoly(Len) 
BW= roipoly(D) 

BW= roipoly(xyl: 
[BWwiyi= roipoly 
[EeywBWwiyil= roipoly( 














































































































dither 通过 拉动 增加 外 观 颜色 分 养 素 ， 转 换 图 像 | Nd OPaeP) 全 

ray2ind 转换 区 度 图 像 为 索引 色 图 像 全 

rayslice 从 灰 度 图 像 创建 引 色 图 像 2 
BW=im2bw(LleveD) 

im2bw 转换 图 像 为 二 进 制图 像 BW= im2bw(X,mapvlevel) 
BW= im2bw(RGB,level) 
了 = 2doublefl 1 

im2double 转换 图 像 矩阵 为 双 精度 型 人 
X2= im2double(X1 indexed ) 

double 转换 数据 为 双 精 度 型 double(X) 

un 转换 数据 为 8 位 无 符 呈 站 型 

im2uint8 转换 图 像 矩 阵 为 8 位 无 符号 整 型 
X2= im2uint8(Xlvindexed) 
ID= im2uint16(I1) 

inm2uintl6 转换 图 像 失 阵 为 16 位 无 符号 下 型 

ntl6 转换 数据 为 16 位 无 符号 下 型 

ind2gray 把 索引 色 图 像 转化 为 灰 度 图 像 三 ind2gray(Xmap) 

inazrgb 转化 索引 色 图 像 为 RGB 真 彩 图 像 RGB= ind2reb(Xmap) 

jw 庆 断 是 否 为 二 进 制图 像 as-isbw(A) 

imy 庆 断 是否 为 大 度 图 像 Te=iseayA) 

ind 庆 电 是 理 为 索引 色 图 像 ae isnd(A) 

ia 基 煌 是否 为 RGB 真 形 图 像 Te iebtA) 

matgray 转化 抵 阵 为 灰 度 图 像 人 

reb2gray 转换 RGB 图 像 或 颜 色 映 射 表 为 灰 度 图 像 | 。 Ra Aronap) 

reb2ind 转换 RGB 图 像 为 索引 色 图 像 | 

iebzind 转换 RGB 图 像 为 索引 色 图 像 0 

表 A-15 工具 箱 参数 设置 的 函数 
函数 功能 语法 
iptgetpref 获取 图 像 处 理工 具 箱 参数 设置 value= iptgetprefprefname) 





iptsetpref 





设置 图 像 处 理工 具 箱 参数 





iptsetpreftprefname value) 














附录 B MATLAB 7.0 图 像 处 理工 具 箱 新 增 函 数 


























































































表 B-1 
函数 功能 语法 
生 adapthisteq) 
adapthisteq 限制 对 比 度 直方 图 均衡 化 Jadapthisteq(Lparaml,vall。 .val 
applycfomm 用 于 色彩 空间 变换 ou applycform(LC) 
riehientbeta 
或 名 瞻 身 到 newmap=brightenbeta) 
brighten 增加 或 降低 颜色 映射 表 的 亮度 人 
brightendfigbeta) 
B= bwboundaries(BW) 
B= bwboundaries(BW.CONN) 
bwboundaries 描绘 二 进 制图 像 边界 B= bwboundarics(BW,CONN,options) 
[B Dj= bwboundaries(…)》 
茹 LN A]= bwboundaries() 
B= bwtraceboundary(BWJ.PJStep) 
ea 进 制图 像 中 的 物体 B= bwtraceboundary(BW PRstepCONN) 
B= bwtraceboundary(…N,din) 
MATLAB 高 级 应 用 一 一 图 像 及 影 [Ynewmap]Fempermute(Xmap) 
bincaaiaa 像 处 理 326 TYnewmap]-empermuteCX map,index) 
查找 颜色 映射 表 中 特定 的 颜色 及 | 。[y。 
相应 的 图 像 TY newmapj-emunique(D) 
0 对 多 通道 图 像 进行 去 相关 处 理 0 
dicomdict 获取 或 读 取 DICOM 文件 | 
P= fan2para(F.D) 
把 pm-beam 投影 转换 为 para-beam | 。 P= fan2para(.…,paramlva:llvparam2.val2,…) 
投影 [P,parallel_locationsparallel_rotation_angles]=fan2 para(…) 
fanbeam 计算 Fan-Beam 变换 
petline 用 鼠标 选择 ployline [xy getline 
[xy]= getine(…, elosedy 
etpts(fie) 
etpts 用 鼠标 选择 像 etpts(ax) 
cy- getpts 
ecE eetrectfae 
etreet 用 上限 标 选择 答 形 rectr getrecttax) 
rect= getrecttfig) 
iceread 读 取 ICC 剖面 Picereadfilename) 
Fifanbeam(F,.D) 
itanbeam 计算 逆 Fan-Beam 变换 有 ifanbeam(…vparaml,vallvparam2,val2…) 
[RH= ifanbeam(…) 
inajavaadd 
训 2ava2dl 将 图 像 转换 为 Java 缓冲 图 像 人 














《 续 ) 






























































函数 功能 语 ”法 
imview(D) 
imview(RGB) 
imview(Xamap) G) 
中 可 
imview 在 图 像 阅览 加 中 显示 图 像 
imview(…, InitialMagnification initial_mag) 
he imview(…) 
imview close all 
TF=ippl 
ippl 检查 IPPL 的 存在 FTF Bippl 
和 显示 图 像 处 理工 具 箱 中 的 索引 色 0 
图 像 
lab2double 把 L*ayb 数据 转换 为 双 精 度 labd= lab2double(lab) 
lab2uint16 把 LYa*b 数据 转换 为 16 位 数据 lab16= lab2uint16(lab) 
Iab2uintg 把 Learb 数据 转换 为 8 位 数据 lab8= lab2uint8(lab) 
C= makecformttype) 
C= makecformttype,whitepoint'WP) 
C= makecform(ice' src_profile, dest_profile) 
makecform 创建 一 个 色彩 转换 结构 C= makecform('ice', src_profile, dest_profile, 
'SourceRenderingIntenf'src_intent'DestRenderingIntent, dest_intent) 
C= makecform(clut;profileLUTtype) 
C= makecform(mattrc'MatTrc,'Direction direction) 
F= para2fan(P.D) 
了 从 parral beam 数据 计算 Fan- | 。 IE para2fan(…;paraml,vallvparam2ival2…) 
的 Beam 映射 [F,fan_positions,fan_rotation_angles 上 = 
fan2para(…) 
ploy2mask 把 多 边 形 区 域 转换 成 mask 区 域 BW= ploy2mask(x,ymn) 
BW=im2bw(Level) 
sim2bw 转换 图 像 为 二 进 制 图 像 
uintlut 查找 表 中 A 的 像素 值 uintlut(ALUT) 
xyz2double 将 颜色 数据 从 XYZ 转换 到 双 精度 xyzd= xyz2double(XYZ) 
xyz2uintl6 将 颜色 数据 从 XYZ 转换 到 十 六 | ”xyzl6- xyzuimtlktoyz 





进 制 








< 和 33 





MATLAB 和 





[1 


器 


喇 


器 


[g 


[ 


[8] 


四 


00 


[1] 
D2] 
[3] 
04] 
05] 
06] 
07] 
[18] 
[19] 
[0] 
BC 
DC2] 
D3] 
D4] 


考 文 献 


Cai T, Brown L. Wavelet Shrinkage for Nonequispaced Samples[J]. Annals of Statistics, 2005, 26(5): 
1783-1799. 
S Mallat Multifrequency Channel Decomposition of Images and Wavelet Models[J]. IEEE Trans, 1998. 
ASSP-37(12): 2091-2110. 

S Mallat S Zhong. Characterization of Signals from Multiscale Edges[]]. IEEE Trans，2003， PAML- 
14(7): 710-732. 
Donoho David L, Johnstone 1 M. ldeal Spatial Adaptation Via Wavelet Shrinkage[J]. Biometric,1998， 
81: 425-455 
Cohen A. Biorthogonal Wavelets[M]. In: C.K. Chui ed. Wavelets: A Tutorial in Theory and Application_ 
Academic Press Ltd, 1999: 123-152. 

Sardy S, et al Wavelet Shrinkage for Unequally Spaced data[]]. Statistics and Computing, 1999, 9(1): 
65-75. 
Zhang Lei， Bao Paul， Wu Xiaolin. Hybrid Inter- and Intra-wavelet Scale Image Restoration[]. Pattern 
Recognition Letter, 2003.36(8): 1737-1746. 
Cohen A. Biorthogonal Wavelets and Dual Filter[], In: M. Barland ed. Wavelets in Image Communication _ 
Elsevier'1994: 1-26. 

Donoho David L. Denoising by Soft-thresholding[J]. IEEE Transactions on Information Theory,1999， 
102): 115-122. 

S Mallat W L Hwang. Singularity Detection and Processing with Wavelets[]. IEEE Trans, 2002, IT- 
38(2): 617-643. 

Mathworks Inc. Wavelet Toolbox User's Guide[M]. 2004. 

思科 技术 产品 研发 中 心 . MATLAB 6.5 辅助 小 波 分 析 与 应 用 [M], 北京 ， 电子 工业 出 版 社 ，2003. 

飞 思科 技术 产品 研发 中 心 . 小 波 分 析 理 论 与 MATLAB7 实现 [M]. 北京 ; 电子 工业 出 版 社 ，2005. 
葛 哲 学 ， 陈 仲 生 . MATLAB 时 频 分 析 技 术 及 其 应 用 [M]. 北京 : 人 民 邮 电 出 版 社 ，2006. 
学 出 版 社 ，1999. 

薛 毅 ,数值 分 析 与 实验 [M]. 北京 : 北京 理工 大 学 出 版 社 ，2005， 

魏 峰 . 应 用 数学 工具 箱 技术 手册 [M] 北京 ,国防 工业 出 版 社 ，2004. 
Wolfram S. The Mathematica Book[M]. Cambridge University Press，1988. 

何 东 健 . 数 : 人 人 人 人 西安 ;西安 电子 科技 大 学 出 版 社 ，2004. 
电子 工业 出 版 社 ，2001. 
崔 屹 . 数字 图 像 处 理 技术 与 应 用 [M]. 北京 : 电子 工业 出 版 社 ，1997. 
阮 秋 琦 . 数字 图 像 处 理 基础 [M]. 北京 : 中 国 铁道 出 版 社 ，1988. 
刘 榴 娣 . 实用 数字 图 像 处 理 [M]. 北京 ; 北京 理工 大 学 出 版 社 ，2001. 

Rafael C.Gonzalez，Digital Image Proccessing Using MATLAB[M]. BeiJing:， Publishing House of 














Electronics Industry，2003. 


D5] 
Pb 
D7] 
P8] 
D9] 
B0] 
B1 
B2] 
B3] 





傅 德 有 性， 寿 益 禾 . 图 形 图 像 处 理学 [M]. 南京 : 东南 大 学 出 版 社 ，2002. 

《. 小 波 分 析 算法 与 应 用 [M]. 西安 ， 西 安 交通 大 学 出 版 社 ，1997. 

. 小 波 分 析 及 其 在 图 像 处 理 中 的 应 用 [M]. 北京 : 科学 出 版 社 ，2002. 
数字 图 像 处 理 [M]. 北京 : 机 械 工业 出 版 社 ，2004. 

数字 图 像 处 理 及 MATLAB 实现 [M]. 重庆 :重庆 大 学 出 版 社 ，2003. 
朱 虹 . 数字 图 像 处 理 基础 [M]. 北京 : 科学 出 版 社 ，2005. 

李 数字 图 像 处 理 及 应 用 [M]. 北京 : 机 械 工 业 出 版 社 ，2004. 

霍 宏 涛 . 数字 图 像 处 理 [M]. 北京 ,机械 工 业 出 版 社 ，2003. 

罗 述 谦 ， 周 果 宏 . 医学 图 像 处 理 与 分 析 [M]. 北京 : 科学 出 版 社 ，2003. 























